[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[文本处理] [已解决]批处理如何统计txt文本每一行出现的次数

本帖最后由 pcl_test 于 2016-10-14 13:30 编辑

例:

a.txt 文本内容:

01 02 03 04
02 03 04 05
03 04 05 06
03 04 05 06
01 02 03 04

以上行数据有重复,求计算出每一行出现的次数。保存为:

b.txt

01 02 03 04=2
02 03 04 05=1
03 04 05 06=2

注:由于需要处理的数据非常大(有1G),所以希望能处理速度快一些的。

1

评分人数

TOP

本帖最后由 qzwifi 于 2015-5-30 13:22 编辑

sort "测试.txt"|gawk "{a[$0]++}END{for (b in a)print b,a}">"结果.txt"

pcl_test 大哥以上是您之前写过的代码,用gawk的速度会快些所以我想用这个。
但现在有个小问题能否修改下以上代码,将得出的结果加一个等于号。

如:
01 02 03 04=2
02 03 04 05=1
03 04 05 06=2

TOP

回复 3# qzwifi


输出部分改为
  1. print b,\"=\",a[b]
复制代码
1

评分人数

TOP

回复 4# pcl_test


    已OK,谢谢!

TOP

  1. rem win7以上系统运行
  2. powershell -c "gc '测试.txt'|group|%%{$_.name+'='+$_.count}"&pause
复制代码

TOP

返回列表