标题: [文本处理] 批处理去除txt中的干扰字符 [打印本页]
作者: honghong33 时间: 2015-3-21 22:41 标题: 批处理去除txt中的干扰字符
在许多txt文件中,存在大量由半角字符构成的干扰码
如
5 \: F( V3 N3 C% h' @
! a- C% }0 P/ Z/ K. O/ w* n: V5 `: B
+ V+ G' m, M3 k0 B; X! O
$ R; a1 H3 @" b" l" O: Y
. k) d2 D9 F/ R1 O$ ?* n
W3 ^$ G9 \: f+ E: U, [' ^6 b) f5 [9 [
6 Z P4 |1 z; o5 c. {. I& w
; x& O3 n% }% _' g$ ?8 J) ?
% m+ z2 ^; @6 Y* b; D
5 \: F( V3 N3 C% h' @
4 x T8 y# }. ]
求批处理删除。
不要误删如
入!4 c: N, ~. A, E8 P f7 \: ~! ~
入!
香吗?”! a- C% }0 P/ Z/ K. O/ w* n: V5 `: B
香吗?”
成)
成)
1992年
1992年
3与21日
3月21日
the baby
the baby
作者: bailong360 时间: 2015-3-21 23:42
本帖最后由 bailong360 于 2015-3-21 23:56 编辑
- @Echo Off
- Set "Str=!+$.,;%%/\:()^&@?*'#{}"
- >$New.txt Grep -vP "^[\w %Str%].*[%Str%]+.*" File.txt
- Pause
复制代码
考虑到每行出现的干扰字符有多个,就没有将所有的干扰字符取齐了,如果发现过滤不正确请自行修改Str的值
Grep下载地址
http://batch-cn.qiniudn.com/tool/2.5.1/grep.exe
作者: pcl_test 时间: 2015-3-21 23:51
回复 1# honghong33
先上传个文本看看
作者: CrLf 时间: 2015-3-22 10:56
与其处理 txt 不如处理 html
作者: honghong33 时间: 2015-3-22 14:33
回复 3# pcl_test
已经在1楼上传
作者: honghong33 时间: 2015-3-22 14:34
与其处理 txt 不如处理 html
CrLf 发表于 2015-3-22 10:56
下载的是txt,没有html文件
作者: honghong33 时间: 2015-3-22 14:34
回复 2# bailong360
grep win7可以用吗
作者: bailong360 时间: 2015-3-22 14:36
回复 7# honghong33
Xp Win7 Win8.1都测试过可以
欢迎光临 批处理之家 (http://www.bathome.net/) |
Powered by Discuz! 7.2 |