批处理之家 - Powered by Discuz! Board

标题: [文本处理] 批处理如何提取文本中字符串长度/字符数等于指定值的行并重新排序？ [打印本页]

作者: necnec1 时间: 2012-11-18 02:35 标题: 批处理如何提取文本中字符串长度/字符数等于指定值的行并重新排序？

本帖最后由 pcl_test 于 2016-8-1 22:14 编辑

一个上G的文本文件  其中有些一行只有10个字符  字母和数字都有
例如 B46AE00890
   C12DE67298
   C12DE67098
   B46AE00790
我想把只有10个字符的行单独提取出来放到一个新文本文件里去

然后把提取出来的文本将最后5个字符再做一次比较把最大的那组数字提取出来
  比如 B46AE00890 B46AE这组 00890是最大的就提取他
         C12DE67298 C12DE这组 67298是最大的就提取他

求助各位高手~

作者: CrLf 时间: 2012-11-18 07:39

findstr /x .......... 1.txt>tmp.txt
sort / 6 /o 2.txt tmp.txt

作者: tmplinshi 时间: 2012-11-19 01:07

本帖最后由 tmplinshi 于 2012-11-19 01:38 编辑

提取 10个字符的行：

grep -E "^[A-Z0-9]{10}$" 1G.txt >10.txt
复制代码

提取最大的组：

sort /r /+5 10.txt | uniq -w 5 >large.txt
复制代码

grep 下载地址: http://www.interlog.com/~tcharron/grep20d_win.zip
uniq 下载地址: http://www.ossh.com/gnu-win32/uniq.exe

欢迎光临批处理之家 (http://www.bathome.net/)