[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[文本处理] [已解决]批处理提取多个文本中的特定字符间的段落

1、文件夹有多个文本mflistpic(*),想把每个文本中的<ul>到</ul>的段落提取出来,存入文本A。每个文本有三个这样的标识。
文本实际上是http源代码。

2、第一步就够了,如果能够这样就更加完美。

<LI><A title="寒地小浆果优质丰产栽培技术" href="read.aspx?ssid=12220093" target=_blank</A>
<P><A title="寒地小浆果优质丰产栽培技术" href="read.aspx?ssid=12220093" target=_blank>寒地小浆果优质丰产栽培技术</A></P></LI>

谢谢!!
1

评分人数

    • Batcher: 感谢主动给标题标注[已解决]字样PB + 2

  1. sed "/<ul>.*<\/ul>/!d;s/<ul><LI>/\n/g;s/<\/LI><\/ul>/\n/g;" mflistpic(1).txt >a.txt
复制代码
1

评分人数

TOP

  1. sed ":a N; s/\n\|\t//g;  ta" test.txt | sed "s/<ul>\|<\/ul>/\n&\n/g;" | sed "/<LI><A /!d" | sed "s/<P>/\n&/g"
复制代码
1

评分人数

TOP

真心地感谢二位帮助!

TOP

返回列表