(gawk.exe 的下载地址见 9 楼)
方案一:按楼主的需求以输入文件去重出结果- gawk "{ID=1;for(i=0;++i<=length($0);){s=substr($0,i,1);if(!b[s]++)if(a[s]++)ID=0}delete b}ID" 1.txt>2.txt
-
- 结果:
- 一个
- 但是
- 自己
- 很多
复制代码 方案二:以输出文件去重出结果(输出结果在不同的行不会出现重复字,本人觉得这个看上去好像更合理)- gawk "{ID=1;for(i=0;++i<=length($0);){s=substr($0,i,1);if(!b[s]++)if(s in a)ID=0}if(ID){for(i=0;++i<=length($0);)a[substr($0,i,1)];print}delete b}" 1.txt>2.txt
-
- 结果:
- 一个
- 但是
- 自己
- 我们
- 这不
- 很多
复制代码
|