Board logo

标题: [文本处理] 批处理提取VeryCD页面中的电驴ED2K链接 [打印本页]

作者: wxcute    时间: 2009-9-22 23:26     标题: 批处理提取VeryCD页面中的电驴ED2K链接

第三方工具
wget.exe:http://bbs.bathome.net/thread-1114-1-1.html
winclip.exe:http://bbs.bathome.net/thread-1766-1-1.html

原理很简单,只是发上来大家分享下。
因数百个链接的页面用浏览器打开太慢,从而想到用 wget 下载页面到时本地再从文本中提取出链接地址。
名字就不好提取了,因为网页是UTF-8编辑格式的,还好也没什么必要^_^。
  1. ::从 VeryCD 页面中提取电驴链接
  2. ::存在 %FN% 代表的文件中
  3. ::查找关键字在 class="forminput" 中
  4. @echo off
  5. set URL="http://www.verycd.com/topics/2727771/"
  6. set FN=XYY.TXT
  7. set TF="%tmp%\tmp$Vcd.txt"
  8. wget -O %TF% %URL% -q
  9. ::notepad "%tmp%\tmp$Vcd.txt"
  10. cd.>%FN%
  11. for /f "tokens=9,10 delims== " %%e in ('findstr /i "min" %TF%') do (
  12.  for /f "delims=" %%d in ("%%e=%%f") do >>%FN% echo %%~d
  13. )
  14. goto :eof
复制代码
当然只对有特定规律的资源有效,如果全导入就简单点。
几个几个输入下载是为了不让一下全放在电驴软件中,因为太多了就会乱得理不清。
利用电驴监视剪贴板的特性实现选择性下载。
  1. ::type a.txt|winclip -c
  2. ::复制文本中字符串到剪贴板中
  3. ::根据链接规律查找关键字
  4. @echo off
  5. echo 如:001,002;再如:003 005。
  6. set/pCN=输入集数,空格或逗号分隔:
  7. set CN=%CN: =, %,
  8. set CN=%CN:,=- %
  9. set FN=XYY.TXT
  10. findstr "%CN%" "%FN%"|winclip -c
复制代码

[ 本帖最后由 wxcute 于 2009-9-22 23:29 编辑 ]




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2