Board logo

标题: [文本处理] 批处理如何从网页中提取a href=标签里的的链接/网址/url [打印本页]

作者: bsxwzy    时间: 2012-4-20 01:30     标题: 批处理如何从网页中提取a href=标签里的的链接/网址/url

本帖最后由 pcl_test 于 2016-11-15 09:02 编辑

从网页下了一个源文件,想提取部分内容
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml"><!-- STATUS OK -->


<a href="/bock/198098629" target="_blank"><img src="
.....省略掉的代码
<a href="/bock/198098729" target="_blank"><img src="
.....省略掉的代码
<a href="/bock/198198729" target="_blank"><img src="
.....省略掉的代码


要提取的内容成txt文本
bock/198098629
bock/198098720
bock/198198329

麻烦高手帮个忙,感谢啊!
作者: apang    时间: 2012-4-20 12:10

  1. @echo off
  2. (for /f "tokens=3 delims== " %%a in ('findstr "bock" a.txt') do (
  3.   set "str=%%~a"
  4.   call echo %%str:~1%%
  5. ))>b.txt
复制代码





欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2