标题: [文本处理] 批处理怎样提取二个特定字符串间的内容? [打印本页]
作者: ghjnihao 时间: 2011-11-8 18:08 标题: 批处理怎样提取二个特定字符串间的内容?
大家好,我有大量TXT文本文件,想把中间的一部分有用内容提出来,请大家帮个忙写一个批处理脚本,
例如,1.TXT文本内容如下,
FGDFGDFGDFG<div class="titleAndAuthor"><h2>7DGFGFDGD86786786/8/414</div><div class="icons">VXCVXCVXCVXC
<div class="titleAndAuthor"><h2>GHGHG5558874148/8/4148CCVXCX452424</div>
<div class="icons">542253544534535435
我想将字符串<div class="titleAndAuthor">与字符串<div class="icons">之间的内容<h2>7DGFGFDGD86786786/8/414</div>; <h2>GHGHG5558874148/8/4148CCVXCX452424</div>提出来至另一文件夹生成2.TXT, 批处理脚本放在源文件目录下就行了,谢谢!
作者: ghjnihao 时间: 2011-11-8 18:14
补充一下,一个.TXT文件有多组这样的特定字符串,字符串<div class="titleAndAuthor">与字符串<div class="icons">有的不在同一行,我想将每组字符串间的内容都提出来.
作者: yangfengoo 时间: 2011-11-8 20:01
参照sed 俺不熟
作者: awk 时间: 2011-11-8 22:15
回复 3# yangfengoo - grep -oE "<h2>[A-Za-z0-9/]+</div>" a.txt
复制代码
作者: ghjnihao 时间: 2011-11-9 02:00
朋友,不能用啊,
作者: BS0小陈 时间: 2011-11-9 08:20
问下 什么sed 啊 grep 貌似没有这些命令啊?怎么才能使用 又给怎么用啊 给个地址学习下也行
作者: awk 时间: 2011-11-9 11:44
回复 6# BS0小陈
http://bbs.bathome.net/thread-1114-1-1.html
作者: lvsehuaxue 时间: 2011-11-9 14:35
- @echo off&setlocal enabledelayedexpansion
- for /f "delims=" %%i in (a.txt) do (
- set "str=%%i"
- set "str=!str:*"^>=!"
- for /f %%a in ("!str!") do (
- set "str=%%a"
- echo !str:~,-4!
- )
- )
- pause
复制代码
欢迎光临 批处理之家 (http://www.bathome.net/) |
Powered by Discuz! 7.2 |