Board logo

标题: [文件操作] 批处理如何提取整个文件夹下html网页文件里的所有超链接? [打印本页]

作者: GOOGLE    时间: 2009-11-27 16:27     标题: 批处理如何提取整个文件夹下html网页文件里的所有超链接?

本帖最后由 pcl_test 于 2016-7-27 22:04 编辑

a文件夹下有多个文件A1.htm,b2.htm,c5.htm等等;a1.htm的超级链接为A2.jpg,A3.jpg等;b2.htm为b4.jpg等;如何取得超级每个.HTM的超级链接,生成形如
A1.htm A2.jpg A3.jpg
B2.htm b4.jpg
的列表?
附件为ZIP格式,去掉扩展名.INF即可.

[ 本帖最后由 GOOGLE 于 2009-11-29 12:41 编辑 ]
作者: Batcher    时间: 2009-11-27 16:42

能否在附件里面上传几个htm文件看看?
作者: GOOGLE    时间: 2009-11-27 17:04

上传不了文件夹。生成的列表为txt格式即可。
1楼已经增加附件.
作者: vsbat    时间: 2009-11-27 17:46

lz 可以压缩上传一个
图片上传用处不大
作者: GOOGLE    时间: 2009-11-30 17:24     标题: 高手在哪?

这个问题好几天了,各位高手在哪?
我想了一个方法不知道怎么实现。使用notepad打开htm格式,寻找关键字<a herf="*.jpg">,然后保存到TXT列表中。
作者: hanyeguxing    时间: 2011-2-2 06:31

  1. @echo off&setlocal enableDelayedExpansion
  2. (for %%a in (*.htm) do (
  3.     set/p"=%%a"<nul
  4.     for /f "delims=" %%b in ('findstr /i /c:"a href=" "%%a"') do (
  5.         set "b=%%b"&set "b=!b:*<a href="=!"
  6.         for /f "delims=>" %%c in ("!b!") do set "c=%%c"&set/p"= !c:~4,-1!"<nul
  7.     )
  8.     echo;
  9. ))>.列表txt
复制代码





欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2