[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[问题求助] [已解决]gawk如何把第一列相同的行拼接

本帖最后由 随风 于 2011-10-28 22:30 编辑

gawk如何把第一列相同的行拼接
如下
  1. c 次
  2. womf 我们
  3. c 寸
  4. c 错
  5. zh 综合s
  6. d 的
  7. zh 综合
  8. d 第
  9. zi 造成
复制代码
要求结果
  1. c 次 寸 错
  2. womf 我们
  3. zh 综合s 综合
  4. d 的 第
  5. zi 造成
复制代码
1

评分人数

    • Batcher: 感谢给帖子标题标注[已解决]字样PB + 2
技术问题请到论坛发帖求助!

感觉我的有点啰唆,有简洁点的方法吗?
  1. {
  2. a[$1]=a[$1] " " $2
  3. c[$1]++
  4. if (c[$1] == 1){i++;b[i]=$1}
  5. }
  6. END {
  7. for (j=1;j<=i;j++) print b[j],a[b[j]]
  8. }
复制代码
技术问题请到论坛发帖求助!

TOP

Perl版本的:(看起来更啰嗦了)
  1. while(<DATA>) {
  2. my($a,$b)=split;
  3. push @{$hash{$a}},$b;
  4. }
  5. for (keys %hash) {
  6. print "$_ @{$hash{$_}}\n";
  7. }
  8. __DATA__
  9. c 次
  10. womf 我们
  11. c 寸
  12. c 错
  13. zh 综合s
  14. d 的
  15. zh 综合
  16. d 第
  17. zi 造成
复制代码

TOP

  1. gawk "{a[$1]=a[$1]\" \"$2}END{for(i in a)print i,a[i]}" a.txt >b.txt
复制代码

TOP

或则单行命令:
  1. perl -lane "push @{$hash{$F[0]}},$F[1];END{print \"$_ @{$hash{$_}}\" for (keys %hash)}" a.txt >b.txt
复制代码

TOP

返回列表