返回列表 发帖
回复 1# qd2024

下载gawk( http://bcn.bathome.net/tool/4.1.3/gawk.exe ),确保文本及脚本都已以ANSI编码格式保存,执行后即可获取想要结果
  1. gawk -F"^★★★★★" "/^★★★★★/{F_n=gensub(/[!&<>/\|:*?\"]+/,\"\",\"g\",$2)}F_n{print $0^>F_n}" 文本.txt
复制代码

TOP

本帖最后由 hfxiang 于 2023-2-5 12:30 编辑

回复 10# qd2024

把Word文档以GB2312编码另存为“最新八年级外研版英语下册课文.txt”,经Windows10下反复测试,如下gawk( http://bcn.bathome.net/tool/4.1.3/gawk.exe )脚本能胜任(无乱码):
  1. gawk -vRS="Module[0-9]+ unit[0-9]+" "F_n{print F_n\"\n\"$0>F_n\".txt\"}{F_n=RT}" 最新八年级外研版英语下册课文.txt
复制代码

TOP

返回列表