[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[文本处理] 批处理获取重复行(只保留一次)

a.txt内容如下:
123
456
789
123
123
789

获取重复的行,并且重复的行只保留一次,处理后得到b.txt内容如下:
123
789

方法1:
  1. @echo off
  2. REM 缺点1:无法处理特别大的文件
  3. REM 缺点2:需要使用文件中没有出现的字符来标记变量(本例中使用的是下划线)
  4. setlocal
  5. for /f "delims=" %%i in (a.txt) do (
  6.     set /a _%%i+=1
  7. )
  8. (for /f "tokens=1-2 delims=_=" %%i in ('set _') do (
  9.     if %%j gtr 1 (
  10.         echo,%%i
  11.     )
  12. ))>b.txt
  13. endlocal
复制代码
方法2:
  1. @echo off
  2. setlocal enabledelayedexpansion
  3. set "PriLine="
  4. set "DupNum=1"
  5. (for /f "delims=" %%i in ('sort a.txt') do (
  6.     if "!PriLine!" equ "%%i" (
  7.         set /a DupNum+=1
  8.     ) else (
  9.         if !DupNum! gtr 1 (
  10.             echo,!PriLine!
  11.         )
  12.         set DupNum=1
  13.     )
  14.     set "PriLine=%%i"
  15. ))>b.txt
  16. if !DupNum! gtr 1 (
  17.     >>b.txt echo,!PriLine!
  18. )
复制代码
方法3:
  1. gawk "{a[$0]++}END{for(i in a)if(a[i]>1)print i}" a.txt > b.txt
复制代码
我帮忙写的代码不需要付钱。如果一定要给,请在微信群或QQ群发给大家吧。
【微信公众号、微信群、QQ群】http://bbs.bathome.net/thread-3473-1-1.html
【支持批处理之家,加入VIP会员!】http://bbs.bathome.net/thread-67716-1-1.html

谢谢,确实在找它。

TOP

不错不错不错不错不错

TOP

不错不错不错不错不错

TOP

回复 4# MCRGZN


    呃,请不要无意义回帖,刷分到此为止

TOP

  1. gawk "a[$0]++" a.txt>b.txt
复制代码
水一个,以前百度看到的解法

TOP

返回列表