标题: [文件操作] [已解决]如何用BAT或VBS脚本提取网页中的字符串? [打印本页]
作者: wewe-b 时间: 2012-2-8 07:38 标题: [已解决]如何用BAT或VBS脚本提取网页中的字符串?
请教如何用 VBS 或 BAT 在以下网页中以 IP:端口 的格式提取出来保存到 TXT 中??
http://www.51proxied.com/http_fast.html
作者: lvsehuaxue 时间: 2012-2-8 12:41
222.88.95.66:8080
222.88.95.66:80
218.80.232.38:8080
221.186.173.1:8080
221.130.162.48:82
112.175.227.204:8080
61.19.127.131:8080
222.88.95.77:80
222.88.95.65:8080
222.88.95.65:80
222.66.88.205:80
222.127.106.89:3128
221.7.159.224:8080
221.224.20.210:8080
221.130.162.48:85
221.130.162.48:84
221.130.162.48:81
221.130.162.48:80
159.226.168.11:80
193.53.4.252:8080
这是将网页中的内容粘贴到文本文件中处理的结果,不知道符合要求否?代码如下:- @echo off&setlocal enabledelayedexpansion
- for /f "delims=" %%i in (a.txt) do (
- if !n!==1 echo !str!:%%i&set n=0
- echo %%i|findstr "^[1-9]*\.[0-9]*\.[0-9]*\.[0-9]*$">nul&&set /a n+=1&set "str=%%i"
- )
- pause
复制代码
作者: ivor 时间: 2012-2-8 14:39
- @echo off
- for /f "tokens=1-4" %%a in (ip.txt) do (
- >>ip1.txt echo %%b:%%c
- )
- pause
复制代码
代码简单化,copy1-30表格的内容到ip.txt
作者: wewe-b 时间: 2012-2-8 15:57
谢谢楼上两位热心高手。
如果我想用 WGET 下载网页到本地,从 HTML 文件格式提取IP到TXT文本中。就是全自动化,不用打开网页浏览器就可完成。
请问 HTML 格式 IP 转 TXT 该怎么写?想过用 SED 和 AWK 。不过都不大好用。
作者: ivor 时间: 2012-2-8 17:05
本帖最后由 ivor 于 2012-2-8 17:11 编辑
回复 4# wewe-b - @echo off & setlocal ENABLEDELAYEDEXPANSION
- set /p website=请输入网页:*.html
- wget http://www.51proxied.com/%website%
- (for /f "tokens=1,2 delims=>" %%a in ('findstr "<td" %website%') do (
- echo %%b
- ))>Temp
- for /f "delims=<" %%c in (Temp) do (
- set /a count+=1
- if !count! equ 2 set ip=%%c
- if !count! equ 3 echo !ip!:%%c >>proxy.txt
- if !count! equ 4 set count=0
- )
- erase %website% Temp
- pause
复制代码
因为我还不知道wget如果指定保存的html文件名,所以不能做的太智能,有BUG再反馈吧,还可以优化,本人懒得很 呵呵,没问题就等后面的人继续发更优秀的来替代我这个 (*^__^*) 嘻嘻……
作者: wewe-b 时间: 2012-2-8 20:15
回复 wewe-b 因为我还不知道wget如果指定保存的html文件名,所以不能做的太智能,有BUG再反馈吧,还可以优 ...
ivor 发表于 2012-2-8 17:05
谢谢指点。代码可以实现自动化了。 又加深了对 For 和 Findstr 的了解.
作者: find 时间: 2012-2-9 22:48
回复 4# wewe-b
你还没学会sed和awk吧
欢迎光临 批处理之家 (http://www.bathome.net/) |
Powered by Discuz! 7.2 |