Board logo

标题: [网络连接] 批处理如何获取网页内容? [打印本页]

作者: 无名小卒    时间: 2015-3-18 09:34     标题: 批处理如何获取网页内容?

本帖最后由 无名小卒 于 2015-3-18 14:49 编辑

如何获取网页内容即网页的上的字 有相关的第三方吗?
作者: 愤怒的CMD    时间: 2015-3-18 09:47

curl 、 wget
作者: 无名小卒    时间: 2015-3-18 12:03

回复 2# 愤怒的CMD


    能详细一点吗
作者: pcl_test    时间: 2015-3-18 12:08

回复 3# 无名小卒
把网址发一下,并把要获取的内容说清楚,在顶楼补充
作者: 无名小卒    时间: 2015-3-18 13:10

回复 4# pcl_test


    我想要教程或方法,而不是某个网站,麻烦啦
作者: CrLf    时间: 2015-3-18 14:35

你要的是网页源码还是网页上的文字
作者: 无名小卒    时间: 2015-3-18 14:47

回复 6# CrLf


    网页上的字
作者: CrLf    时间: 2015-3-18 15:58

先 curl,再 HtoX32c
或者直接用 js 或 vbs 取得 document.documentElement.innerText
作者: zjghjs    时间: 2015-3-20 10:11

看不懂,搞不明,看来得好好学习
作者: 愤怒的CMD    时间: 2015-3-20 10:35

以小说某一章节举例说明:
  1. wget -O 1.txt http://www.52xiaoshuo.com/files/article/html/11/11245/2375650.html
复制代码
得到网页的源文件后再转换
  1. HtoX32c /IP 1.txt>2.txt
复制代码
那么2.txt中的就是小说章节内容了




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2