标题: [文本处理] 【已处理】求助批处理大容量txt文件内容处理 [打印本页]
作者: chouxia 时间: 2018-7-28 12:59 标题: 【已处理】求助批处理大容量txt文件内容处理
本帖最后由 chouxia 于 2018-7-30 11:30 编辑
txt文件有600M+
格式类似
FucARi-30LABO6960-Xxl3g0Bwv5 84964 FucARi-30LABO6960-Xxl3g0Bwv5 15039706753233298 image/jpg 0
FucAS4gFVVgtapGze63kc1KACI4G 574681 FucAS4gFVVgtapGze63kc1KACI4G 14989922964949320 image/jpg 0
FucASgJ_QDXVYWnQ9oKrNRGZvduM 4190238 FucASgJ_QDXVYWnQ9oKrNRGZvduM 15063410344228857 video/mp4 0
FucASqAA6ybMr2UwG_QtKQYvGZqO 236556 FucASqAA6ybMr2UwG_QtKQYvGZqO 14919874984538929 image/jpg 0
FucASr-HzWHbQSbyDoDSGbpJTh5N 310457 FucASr-HzWHbQSbyDoDSGbpJTh5N 15134984053442965 image/jpg 0
FucATEvnAbWG0dD9EjBOceh3eg3K 822160 FucATEvnAbWG0dD9EjBOceh3eg3K 14889390424712556 image/jpg 0
FucATZj2CRRYYI3hLT_kiE0WpaA9 444800 FucATZj2CRRYYI3hLT_kiE0WpaA9 15153759005108874 image/jpg 0
FucAUQkBtT5FAge2wmf2X_WKXSda 848052 FucAUQkBtT5FAge2wmf2X_WKXSda 14882581884940161 image/jpg 0
FucAUl2IGRBpMJRNzjYPkXjWLeZT 173973 FucAUl2IGRBpMJRNzjYPkXjWLeZT 15111525873312581 image/jpg 0
FucAUyJOapu9rDtvZfwJCgfQy60Q 531997 FucAUyJOapu9rDtvZfwJCgfQy60Q 14842156497758102 image/jpg 0
FucAVg7SfVKaqAdLdJZxvj-zuQr_ 447380 FucAVg7SfVKaqAdLdJZxvj-zuQr_ 15197087128144549 image/jpg 0
FucAWI0fOJFXrP4PpvseHps4mf71 263119 FucAWI0fOJFXrP4PpvseHps4mf71 15043337372582212 image/jpg 0
FucAWnXJGKzyXmHsV35iPSrGmMNF 444617 FucAWnXJGKzyXmHsV35iPSrGmMNF 15063344035736789 image/jpg 0
现在当第五列是image/jpg或者video/mp4的时候取出第一列和第四列内容导出到新的txt文件中。
文件太大了,我用for in do 做个bat,结果没反应。
请教下 这个情况要怎么处理?
作者: yhcfsr 时间: 2018-7-28 14:07
本帖最后由 yhcfsr 于 2018-7-28 14:12 编辑
- 只少数几个文件的话,用Notepad++等支持正则的软件处理.推荐此法,直观方便快捷,几百万行的大文件处理起来也就10来秒的事情
- 文件多的话,用VBS,JS,POWERSHELL处理,如果一定要BAT,可以将VBS,JS,POWERSHELL的代码放在BAT中执行,或者直接在BAT中调用脚本.
作者: cfwyy77_bat 时间: 2018-7-28 21:56
可以试试 awk/gawk- gawk '{if ($5=="image/jpg" || $5=="video/mp4"){print $1,$4}}' 1.txt >2.txt
复制代码
作者: chouxia 时间: 2018-7-30 11:30
您这个执行错误,我用别的方法解决了。谢谢热心帮忙
欢迎光临 批处理之家 (http://www.bathome.net/) |
Powered by Discuz! 7.2 |