Board logo

标题: [文本处理] 批处理如何删除文本里的重复行(相同行只保留一条)? [打印本页]

作者: smallbat    时间: 2014-12-7 10:31     标题: 批处理如何删除文本里的重复行(相同行只保留一条)?

本帖最后由 pcl_test 于 2016-8-5 23:14 编辑

文本里的内容是按一行一行的来书写的,形如
1
2
3
4
5
6
7
1
3


很显然里面有重复行,想让删除重复行,比如上面1和3是重复的,把这2个重复了的删除掉
1
2
3
4
5
6
7
作者: pcl_test    时间: 2016-8-5 23:13

  1. @echo off
  2. for /f "delims=" %%a in ('dir /a-d/b "文本.txt"') do (
  3.     (for /f "delims=" %%b in ('type "%%a"') do (
  4.         if not defined #%%b (echo;%%b&set "#%%b=1")
  5.     ))>"%%~dpaNew_%%~nxa"
  6. )
  7. pause
复制代码

作者: pcl_test    时间: 2016-8-5 23:35

  1. //&cls&dir /a-d/b "文本.txt"|cscript -nologo -e:jscript "%~f0"&pause&exit
  2. var fso = new ActiveXObject('Scripting.Filesystemobject');
  3. while(!WSH.StdIn.AtEndOfStream){
  4.     try{
  5.         var file = WSH.StdIn.ReadLine();
  6.         var text = unique(file);
  7.         var f = file.replace(/(.+\\)?([^\\]+)/, '$1New_$2');
  8.         fso.CreateTextFile(f, 2).Write(text);
  9.     }catch(e){}
  10. }
  11. WSH.echo('Done');
  12. function unique(file){
  13.     var f = fso.OpenTextFile(file, 1), s='', map={};
  14.     while(!f.AtEndOfStream){
  15.         var line = f.ReadLine();
  16.         if(!/^[ \s]*$/.test(line)&&!map[line]){s+=line+'\r\n';map[line]=1}
  17.     }
  18.     f.Close();
  19.     return s
  20. }
复制代码

作者: pcl_test    时间: 2016-8-6 00:40

本帖最后由 pcl_test 于 2016-8-6 00:43 编辑

第三方gawk
http://www.bathome.net/s/tool/index.html?key=gawk
  1. #*&cls&dir /a-d/b "文本.txt"|gawk -f "%~f0"&pause&exit
  2. BEGIN{
  3.     while(getline file>0){
  4.         delete map;delete a;s="";
  5.         while(getline<file>0){
  6.             if($0!~/^[ [:space:]]*$/){
  7.                 if(!map[$0]){s=s$0"\n";map[$0]++;}
  8.             }
  9.         }
  10.         match(file, /(.+\\)?([^\\]+)/, a);
  11.         print s>a[1]"New_"a[2]
  12.     }
  13. }END{print "Done"}
复制代码





欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2