批处理之家 - Powered by Discuz! Board

标题: [网络连接] 批处理如何获取网页内容？ [打印本页]

作者: 无名小卒 时间: 2015-3-18 09:34 标题: 批处理如何获取网页内容？

本帖最后由无名小卒于 2015-3-18 14:49 编辑

如何获取网页内容即网页的上的字有相关的第三方吗？

作者: 愤怒的CMD 时间: 2015-3-18 09:47

curl 、 wget

作者: 无名小卒 时间: 2015-3-18 12:03

回复 2# 愤怒的CMD

能详细一点吗

作者: pcl_test 时间: 2015-3-18 12:08

回复 3# 无名小卒
把网址发一下，并把要获取的内容说清楚，在顶楼补充

作者: 无名小卒 时间: 2015-3-18 13:10

回复 4# pcl_test

我想要教程或方法,而不是某个网站,麻烦啦

作者: CrLf 时间: 2015-3-18 14:35

你要的是网页源码还是网页上的文字

作者: 无名小卒 时间: 2015-3-18 14:47

回复 6# CrLf

网页上的字

作者: CrLf 时间: 2015-3-18 15:58

先 curl，再 HtoX32c
或者直接用 js 或 vbs 取得 document.documentElement.innerText

作者: zjghjs 时间: 2015-3-20 10:11

看不懂，搞不明，看来得好好学习

作者: 愤怒的CMD 时间: 2015-3-20 10:35

以小说某一章节举例说明:

wget -O 1.txt http://www.52xiaoshuo.com/files/article/html/11/11245/2375650.html
复制代码

得到网页的源文件后再转换

HtoX32c /IP 1.txt>2.txt
复制代码

那么2.txt中的就是小说章节内容了

欢迎光临批处理之家 (http://www.bathome.net/)