[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖
回复 7# WHY

应Batcher版主提议,已修改一楼的例句,可能能代表更实际的复杂情况。你的代码测试可去掉 舞台 那句里的,第一句反复执行无变化。
谢谢。麻烦你再看看。
目的,学习批处理

TOP

回复 3# hlzj88


    已修改

TOP

回复 4# Batcher
已重新举例。
回复 5# 523066680
你说的是,对正则表达一头雾水,sed使用也浅。好吧,不给自己找理由。也谢谢你。
目的,学习批处理

TOP

本帖最后由 523066680 于 2018-12-17 20:23 编辑

回复 3# hlzj88

    2楼已经给出了核心思路。相信好学的人已经能够举一反三,而不是丢一句 “经测试不成功”。

加个循环的事儿~ Perl
  1. my $s='其他词“其他词<br>a<br>其他词”其他词';
  2. while ($s=~s/(“[^“”]+)<br>([^“”]+”)/$1$2/) {};
  3. print $s;
复制代码

TOP

回复 3# hlzj88


    请在顶楼给个具体的例子吧
我帮忙写的代码不需要付钱。如果一定要给,请在微信群或QQ群发给大家吧。
【微信公众号、微信群、QQ群】http://bbs.bathome.net/thread-3473-1-1.html
【支持批处理之家,加入VIP会员!】http://bbs.bathome.net/thread-67716-1-1.html

TOP

本帖最后由 hlzj88 于 2018-12-22 22:27 编辑

回复 2# WHY

这个代码是专职 从网页文件提取正文的。

1网页提取.bat  设计要使它能兼容不同网页编码,不同行长,gizp压缩网页,不同排版。使提取的网页正文尽量干净。产生是文本要通过重新排版,使内容更符合常规断句。要求能独立运行,也可被别的文件调用。

附件已上传,http://www.bathome.net/attachmen ... XhxTUo4dzd1WQ%3D%3D
目的,学习批处理

TOP

本帖最后由 WHY 于 2018-12-17 21:30 编辑
  1. sed -r ":a;s/(“[^“”]*)<br>([^“”]*”)/\1\2/g;ta" 1.txt > 2.txt
复制代码
1

评分人数

TOP

返回列表