Board logo

标题: [文本处理] 批处理如何统计txt文本每一行出现过的次数? [打印本页]

作者: qzwifi    时间: 2012-4-14 20:53     标题: 批处理如何统计txt文本每一行出现过的次数?

本帖最后由 pcl_test 于 2016-9-3 15:21 编辑

有一份文本数据要知道其中每一行所出现过的次数,求批处理代码

例如:
01 02 03 04 05 06
01 02 03 04 05 07
01 02 03 04 05 08
01 02 03 04 05 09
01 02 03 04 05 10
01 02 03 04 05 07
01 02 03 04 05 08
01 02 03 04 05 08
01 02 03 04 05 09
01 02 03 04 05 10

批处理后保存为文本:
01 02 03 04 05 06   出现1次
01 02 03 04 05 07   出现2次
01 02 03 04 05 08   出现3次
01 02 03 04 05 09   出现2次
01 02 03 04 05 10   出现2次
01 02 03 04 05 07   出现2次
01 02 03 04 05 08   出现3次
01 02 03 04 05 08   出现3次
01 02 03 04 05 09   出现2次
01 02 03 04 05 10   出现2次
作者: yangfengoo    时间: 2012-4-14 21:03

>new.txt (for /f "tokens=*" %%a in (test.txt) do for /f "tokens=3" %%b in ('find /c "%%a" "test.txt"') do echo %%a 出现%%b次)
作者: qzwifi    时间: 2012-4-14 21:18

谢谢 yangfengoo ,这个保存的结果会带路径,而且速度非常慢。能否再改进下呢?
作者: gawk    时间: 2012-4-14 21:36

  1. gawk "{a[$0]++}END{for(i in a)print i\" shows \"a[i]\" times\"}" a.txt
复制代码

作者: CrLf    时间: 2012-4-14 22:12

  1. @echo off&setlocal enabledelayedexpansion
  2. for /f "delims=" %%a in ('sort a.txt') do (
  3.    if %%a neq !last! (
  4.       if defined last echo !last!=!n! 次
  5.       set n=
  6.    )
  7.    set /a n+=1
  8.    set last=%%a
  9. )
  10. echo !last!=!n! 次
  11. pause
复制代码

作者: qzwifi    时间: 2012-4-14 22:30

本帖最后由 qzwifi 于 2012-4-14 23:33 编辑

多谢各位大哥!




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2