Board logo

标题: [文本处理] 批处理如何提取BING.CN里的连接? [打印本页]

作者: zahirll    时间: 2011-3-11 04:31     标题: 批处理如何提取BING.CN里的连接?

批处理打开这个页面然后抓取里面的连接http://cn.bing.com/search?count=1000&q=ip:58.215.64.136
58.215.64.136这个IP是要变的,每次查询都换的,把里面的连接抓出来保存到1.TXT里,然后在执行这段代码
  1. @echo off
  2. more +9 "%~f0" >GetUrlText.vbs
  3. type nul >2.txt
  4. for /f %%a in (1.txt) do (
  5.     echo 正在检测:%%a
  6.     cscript //nologo GetUrlText.vbs %%a/123.aspx | findstr "<title>无法找到资源。</title>" && >>2.txt echo,%%a
  7. )
  8. goto :eof
  9. strURL=WScript.Arguments(0)
  10. WScript.Echo strURL
  11. Set objXmlHttp = CreateObject("Microsoft.XMLHTTP")
  12. objXmlHttp.Open "GET",strURL,0
  13. objXmlHttp.Send()
  14. Set objStream = CreateObject("ADODB.Stream")
  15. objStream.Mode = 3
  16. objStream.Type = 1
  17. objStream.Open()
  18. objStream.Write(objXmlHttp.responsebody)
  19. objStream.Position = 0
  20. objStream.Type = 2
  21. objStream.Charset = "utf-8"
  22. strText = objStream.Readtext
  23. WScript.Echo strText
复制代码

[ 本帖最后由 zahirll 于 2011-3-12 18:37 编辑 ]
作者: zahirll    时间: 2011-3-11 14:07

管理。。。。。。。。。。。。。
作者: Batcher    时间: 2011-3-11 20:11

http://cn.bing.com/search?count=1000&q=ip:58.215.64.136为例,你希望1.txt里面的内容长什么样子?
作者: zahirll    时间: 2011-3-12 18:38

希望格式是
http://123123.com
http://22222.com
http://11111.com
一个地址一行
作者: zahirll    时间: 2011-3-13 11:48

怎么没人帮忙啊。。。。。
作者: Batcher    时间: 2011-3-13 11:54

打开顶楼链接之后显示:
Ref A: CAB6146852B04F69A336665200EBB177 Ref B: 50E51EABBFF8A4225454FE43914B6E40 Ref C: Sat Mar 12 19:53:58 2011 PST

看不到任何链接
作者: zahirll    时间: 2011-3-13 12:02

可以啊,你现在再开看看
作者: Batcher    时间: 2011-3-13 14:19     标题: 回复 7楼 的帖子

打开http://cn.bing.com/之后搜索哪个关键字?我自己试试
作者: zahirll    时间: 2011-3-13 19:55

ip:58.215.64.136 输入这个。但是直接输入没有count=1000这个参数,他每页只显示10条,count=1000是一页显示1000条,这样他能全部显示玩,不然他分几页才能显示完
作者: zahirll    时间: 2011-3-15 00:44

管理大大。。。。。。。
作者: zahirll    时间: 2011-3-15 19:14

顶上~~~~~~~~~
作者: zahirll    时间: 2011-3-17 19:26

唉~~~~~~~~~~~~~~




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2