Board logo

标题: [文本处理] 批处理去除txt中的干扰字符 [打印本页]

作者: honghong33    时间: 2015-3-21 22:41     标题: 批处理去除txt中的干扰字符

在许多txt文件中,存在大量由半角字符构成的干扰码

5 \: F( V3 N3 C% h' @
! a- C% }0 P/ Z/ K. O/ w* n: V5 `: B
+ V+ G' m, M3 k0 B; X! O
$ R; a1 H3 @" b" l" O: Y
. k) d2 D9 F/ R1 O$ ?* n
W3 ^$ G9 \: f+ E: U, [' ^6 b) f5 [9 [
6 Z  P4 |1 z; o5 c. {. I& w
; x& O3 n% }% _' g$ ?8 J) ?
% m+ z2 ^; @6 Y* b; D
5 \: F( V3 N3 C% h' @
4 x  T8 y# }. ]

求批处理删除。
不要误删如
入!4 c: N, ~. A, E8 P  f7 \: ~! ~
入!

香吗?”! a- C% }0 P/ Z/ K. O/ w* n: V5 `: B
香吗?”

成)
成)

1992年
1992年

3与21日
3月21日

the baby
the baby
作者: bailong360    时间: 2015-3-21 23:42

本帖最后由 bailong360 于 2015-3-21 23:56 编辑
  1. @Echo Off
  2. Set "Str=!+$.,;%%/\:()^&@?*'#{}"
  3. >$New.txt Grep -vP "^[\w %Str%].*[%Str%]+.*" File.txt
  4. Pause
复制代码
考虑到每行出现的干扰字符有多个,就没有将所有的干扰字符取齐了,如果发现过滤不正确请自行修改Str的值
Grep下载地址
http://batch-cn.qiniudn.com/tool/2.5.1/grep.exe
作者: pcl_test    时间: 2015-3-21 23:51

回复 1# honghong33
先上传个文本看看
作者: CrLf    时间: 2015-3-22 10:56

与其处理 txt 不如处理 html
作者: honghong33    时间: 2015-3-22 14:33

回复 3# pcl_test


    已经在1楼上传
作者: honghong33    时间: 2015-3-22 14:34

与其处理 txt 不如处理 html
CrLf 发表于 2015-3-22 10:56



    下载的是txt,没有html文件
作者: honghong33    时间: 2015-3-22 14:34

回复 2# bailong360


    grep win7可以用吗
作者: bailong360    时间: 2015-3-22 14:36

回复 7# honghong33


    Xp Win7 Win8.1都测试过可以




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2