标题: [文本处理] 【已解决】gawk:如何合并多行多列同类相,且对应右侧数值求和 [打印本页]
作者: 思想之翼 时间: 2023-9-11 22:26 标题: 【已解决】gawk:如何合并多行多列同类相,且对应右侧数值求和
本帖最后由 思想之翼 于 2023-9-12 11:04 编辑
【示例】
D:\DATA\A.txt 记录数值只有2列,格式如下:
331 20000
550 3333
653 19999
331 20000
653 11111
550 3333
合并左侧同类相,且右侧数值求和。
结果B.txt为:
331 40000
550 6666
653 31110
【解决方案】- gawk "{a[$1]+=$2}END{for(i in a)print i,a[i]}" A.txt > B.txt
复制代码
【问题1】
若D:\DATA\A.txt 记录数值多行多列(示例只列举了6列),格式如下:
331 20000 653 11111 653 19999
550 3333 331 20000 550 3333
如何用gawk,合并第1 3 5列同类相,第2 4 6列对应数值求和?
结果B.txt为:
331 40000
550 6666
653 31110
【问题2】
若上例结果B.txt,以第2列数值从多到少排序,在此基础上,第1列数值从小到大排序,如何用gawk解决?
示例:
331 40000【第2列数值最多】
456 40000
000 31110【第2列数值次多】
653 31110
550 6666 【第2列数值最少】
666 6666
888 6666
作者: Five66 时间: 2023-9-11 23:43
不知行否?输出是无序的- gawk "{for(i=1;i<=NF;i++){if(i%%2==0){A[$(i-1)]+=$i}}}END{for(i in A){print i\" \"A[i]}}" D:\DATA\A.txt >B.txt
复制代码
作者: wanghan519 时间: 2023-9-12 06:15
本帖最后由 wanghan519 于 2023-9-12 09:48 编辑
加上一句xargs -n2也许可以- cat a.txt | xargs -n2 | awk '{a[$1]+=$2}END{for(i in a)print i,a[i]}'
复制代码
排序大概是- cat a.txt | xargs -n2 | sort -k2nr -k1n
复制代码
用的是busybox-w32
作者: buyiyang 时间: 2023-9-12 09:11
改一下输出顺序- gawk "function cmp_num(i1,v1,i2,v2){return (v1<v2?1:(v1>v2?-1:(i1<i2?-1:(i1>i2?1:0))))}{n=NF;while(i=n--)if(i%%2==0)A[$(i-1)]+=$i}END{PROCINFO[\"sorted_in\"]=\"cmp_num\";for(i in A){print i\" \"A[i]}}" D:\DATA\A.txt >B.txt
复制代码
欢迎光临 批处理之家 (http://www.bathome.net/) |
Powered by Discuz! 7.2 |