[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[文本处理] 【已解决】gawk:如何合并多行多列同类相,且对应右侧数值求和

本帖最后由 思想之翼 于 2023-9-12 11:04 编辑

【示例】
D:\DATA\A.txt 记录数值只有2列,格式如下:
331        20000
550        3333
653        19999
331        20000
653        11111
550        3333
合并左侧同类相,且右侧数值求和。
结果B.txt为:
331        40000
550        6666
653        31110
【解决方案】
  1. gawk "{a[$1]+=$2}END{for(i in a)print i,a[i]}" A.txt > B.txt
复制代码
【问题1】
若D:\DATA\A.txt 记录数值多行多列(示例只列举了6列),格式如下:
331        20000        653        11111        653        19999
550        3333          331        20000        550        3333
如何用gawk,合并第1 3 5列同类相,第2 4 6列对应数值求和?
结果B.txt为:
331        40000
550        6666
653        31110

【问题2】
若上例结果B.txt,以第2列数值从多到少排序,在此基础上,第1列数值从小到大排序,如何用gawk解决?
示例:
331        40000【第2列数值最多】
456        40000
000        31110【第2列数值次多】
653        31110
550        6666  【第2列数值最少】
666        6666
888        6666
1

评分人数

    • Batcher: 感谢给帖子标题标注[已解决]字样PB + 2

不知行否?输出是无序的
  1. gawk "{for(i=1;i<=NF;i++){if(i%%2==0){A[$(i-1)]+=$i}}}END{for(i in A){print i\" \"A[i]}}" D:\DATA\A.txt >B.txt
复制代码
1

评分人数

TOP

本帖最后由 wanghan519 于 2023-9-12 09:48 编辑

加上一句xargs -n2也许可以
  1. cat a.txt | xargs -n2 | awk '{a[$1]+=$2}END{for(i in a)print i,a[i]}'
复制代码
排序大概是
  1. cat a.txt | xargs -n2 | sort -k2nr -k1n
复制代码

用的是busybox-w32
1

评分人数

TOP

改一下输出顺序
  1. gawk "function cmp_num(i1,v1,i2,v2){return (v1<v2?1:(v1>v2?-1:(i1<i2?-1:(i1>i2?1:0))))}{n=NF;while(i=n--)if(i%%2==0)A[$(i-1)]+=$i}END{PROCINFO[\"sorted_in\"]=\"cmp_num\";for(i in A){print i\" \"A[i]}}" D:\DATA\A.txt >B.txt
复制代码
1

评分人数

TOP

返回列表