标题: [文本处理] 批处理提取VeryCD页面中的电驴ED2K链接 [打印本页]
作者: wxcute 时间: 2009-9-22 23:26 标题: 批处理提取VeryCD页面中的电驴ED2K链接
第三方工具
wget.exe:http://bbs.bathome.net/thread-1114-1-1.html
winclip.exe:http://bbs.bathome.net/thread-1766-1-1.html
原理很简单,只是发上来大家分享下。
因数百个链接的页面用浏览器打开太慢,从而想到用 wget 下载页面到时本地再从文本中提取出链接地址。
名字就不好提取了,因为网页是UTF-8编辑格式的,还好也没什么必要^_^。- ::从 VeryCD 页面中提取电驴链接
- ::存在 %FN% 代表的文件中
- ::查找关键字在 class="forminput" 中
- @echo off
- set URL="http://www.verycd.com/topics/2727771/"
- set FN=XYY.TXT
- set TF="%tmp%\tmp$Vcd.txt"
- wget -O %TF% %URL% -q
- ::notepad "%tmp%\tmp$Vcd.txt"
- cd.>%FN%
- for /f "tokens=9,10 delims== " %%e in ('findstr /i "min" %TF%') do (
- for /f "delims=" %%d in ("%%e=%%f") do >>%FN% echo %%~d
- )
- goto :eof
复制代码
当然只对有特定规律的资源有效,如果全导入就简单点。
几个几个输入下载是为了不让一下全放在电驴软件中,因为太多了就会乱得理不清。
利用电驴监视剪贴板的特性实现选择性下载。- ::type a.txt|winclip -c
- ::复制文本中字符串到剪贴板中
- ::根据链接规律查找关键字
- @echo off
- echo 如:001,002;再如:003 005。
- set/pCN=输入集数,空格或逗号分隔:
- set CN=%CN: =, %,
- set CN=%CN:,=- %
- set FN=XYY.TXT
- findstr "%CN%" "%FN%"|winclip -c
复制代码
[ 本帖最后由 wxcute 于 2009-9-22 23:29 编辑 ]
欢迎光临 批处理之家 (http://www.bathome.net/) |
Powered by Discuz! 7.2 |