标题: [文本处理] [已解决]批处理怎样从文档中提取超链接? [打印本页]
作者: fanfande 时间: 2010-9-11 18:02 标题: [已解决]批处理怎样从文档中提取超链接?
本帖最后由 fanfande 于 2011-8-30 00:51 编辑
txt文档里面N多网址原始格式如下:
<a title="百度百科" href="http://baike.baidu.com/">百度百科</a>
<a title="网址之家" href="http://www.hao123.com/">网址之家</a>
<a title="sina博客" href="http://blog.sina.com.cn/">sina博客</a>
<a title="西祠胡同" href="http://www.xici.net/">西祠胡同</a>
等等。。。
需要处理成如下格式:
百度百科,http://baike.baidu.com/,1
网址之家,http://www.hao123.com/,1
sina博客,http://blog.sina.com.cn/,1
西祠胡同,http://www.xici.net/,1
逗号是半角的
这个提问的标题实在想不出如何定一个标题,值班斑竹可以帮我想一个,谢谢!
作者: edmond 时间: 2010-9-11 18:48
- @echo off
- setlocal enabledelayedexpansion
- for /f "delims= tokens=1-10" %%a in (1.txt) do (
- set m=%%a
- set m=!m:~10!
- set m=!m:"=~!
- echo !m!>>tem1.txt
- )
-
- for /f "delims=~ tokens=1-10" %%i in (tem1.txt) do (
- echo %%i,%%k,1 >>list.txt
- )
- del tem1.txt
-
- pause
复制代码
我不会用"作分隔符阿,只能多走几步了。
作者: asnahu 时间: 2010-9-11 19:24
- @echo off
- gawk "BEGIN{FS=\"\x22\";OFS=\",\"}{print $2,$4,"1"}" urfile
- exit
复制代码
作者: 随风 时间: 2010-9-11 20:24
- @echo off
- for /f "tokens=1,2 delims=<>" %%a in (a.txt) do (
- set "str=%%a"
- setlocal enabledelayedexpansion
- set "str=!str:~0,-1!,1"
- set "str=!str:*http:=!"
- echo %%b,http:!str!
- endlocal
- )
- pause
复制代码
作者: fanfande 时间: 2010-9-12 07:01
假如原始格式是这样的
百度百科==http://baike.baidu.com==可以方便提出问题回答问题的地方
网址之家==http://www.hao123.com==网民收藏最多的网址
西祠胡同==http://www.xici.net/==西祠社区,总部在南京
需要处理成如下格式:
百度百科,http://baike.baidu.com/,1
网址之家,http://www.hao123.com/,1
西祠胡同,http://www.xici.net/,1
规律是取的 ==左边的内容 ==右边的被替换成了1
谢谢2楼
作者: asnahu 时间: 2010-9-12 08:24
- gawk "BEGIN{FS=\"=+\";OFS=\",\";str="1"}{print $1,$2,str}" urfile
复制代码
作者: Batcher 时间: 2010-9-12 11:21 标题: 回复 5楼 的帖子
能否把问题更新到顶楼?
欢迎光临 批处理之家 (http://www.bathome.net/) |
Powered by Discuz! 7.2 |