标题: [网络连接] 批处理如何获取网页内容? [打印本页]
作者: 无名小卒 时间: 2015-3-18 09:34 标题: 批处理如何获取网页内容?
本帖最后由 无名小卒 于 2015-3-18 14:49 编辑
如何获取网页内容即网页的上的字 有相关的第三方吗?
作者: 愤怒的CMD 时间: 2015-3-18 09:47
curl 、 wget
作者: 无名小卒 时间: 2015-3-18 12:03
回复 2# 愤怒的CMD
能详细一点吗
作者: pcl_test 时间: 2015-3-18 12:08
回复 3# 无名小卒
把网址发一下,并把要获取的内容说清楚,在顶楼补充
作者: 无名小卒 时间: 2015-3-18 13:10
回复 4# pcl_test
我想要教程或方法,而不是某个网站,麻烦啦
作者: CrLf 时间: 2015-3-18 14:35
你要的是网页源码还是网页上的文字
作者: 无名小卒 时间: 2015-3-18 14:47
回复 6# CrLf
网页上的字
作者: CrLf 时间: 2015-3-18 15:58
先 curl,再 HtoX32c
或者直接用 js 或 vbs 取得 document.documentElement.innerText
作者: zjghjs 时间: 2015-3-20 10:11
看不懂,搞不明,看来得好好学习
作者: 愤怒的CMD 时间: 2015-3-20 10:35
以小说某一章节举例说明:- wget -O 1.txt http://www.52xiaoshuo.com/files/article/html/11/11245/2375650.html
复制代码
得到网页的源文件后再转换复制代码
那么2.txt中的就是小说章节内容了
欢迎光临 批处理之家 (http://www.bathome.net/) |
Powered by Discuz! 7.2 |