Board logo

标题: [文本处理] 批处理如何删除文本中以指定字符分割成两列的第二列内容为纯数字/纯字母的行 [打印本页]

作者: Rasm    时间: 2017-1-4 16:16     标题: 批处理如何删除文本中以指定字符分割成两列的第二列内容为纯数字/纯字母的行

本帖最后由 pcl_test 于 2017-1-14 02:21 编辑

批处理如何批量删除纯数字所在的行数?
  1. jhfgudeli|wodima123
  2. jhfgudeli|jhfgudeli
  3. jhfgudeli|7204381
  4. jest1314527|1314527
  5. jeffnomms|fanzhe128
  6. jaychen3326|wfd901215
  7. jaychen3326|123456
  8. jasonlouhao|jasonlouhao
  9. jasonlouhao|asd138
  10. jasonlee123|jasonlee123
  11. jasonlee123|19880918
  12. jasonlee123|123123
  13. jaskjay|63619063qw
复制代码
目前数据是这样,想把“|”右侧数据是纯数字的内容都删除,留下字母+数字的内容,“|”前面的内容不管

结果是:
  1. jhfgudeli|wodima123
  2. jhfgudeli|jhfgudeli
  3. jeffnomms|fanzhe128
  4. jaychen3326|wfd901215
  5. jasonlouhao|jasonlouhao
  6. jasonlouhao|asd138
  7. jasonlee123|jasonlee123
  8. jasonlee123|19880918
  9. jaskjay|63619063qw
复制代码
================================经过一楼的回复,已经实现了想要的效果。确实非常棒

请教,如何删除纯数字和纯字母呢,因为我只想要字母+数字的内容
作者: flyinnet9    时间: 2017-1-4 17:44

  1. @echo off
  2. for /f "tokens=1-2 delims=|" %%a in (test.txt) do (
  3.   for /f "delims=0123456789" %%c in ("#%%b") do if not "%%c"=="#" echo.%%a^|%%b
  4. )
  5. pause
复制代码

作者: /zhqsystem/zhq    时间: 2017-1-4 20:42

回复 1# Rasm
样本和说明真烂
  1. for /f "tokens=1,* delims=|" %%i in ('type "1.txt"') do (
  2. set "#=%%j"
  3. for /l %%n in (0,1,9)do set "#=%%n!#!"
  4. for /l %%n in (0,1,9)do set "#=!#:%%~n=!"
  5. if defined # echo,%%j
  6. )
复制代码

作者: GNU    时间: 2017-1-4 23:26

回复 3# /zhqsystem/zhq


    你的代码根本没测试就发出来了吧
作者: Rasm    时间: 2017-1-5 00:59

回复 4# WHY


    没有效果
作者: /zhqsystem/zhq    时间: 2017-1-5 01:33

回复 5# GNU
醉了,我测试了只是少写了个空格检测和变量延迟只写主要的东西更直观,不过不测试也能正常通过,经常忘标点少打个字符比较常见
作者: GNU    时间: 2017-1-5 10:27

回复 7# /zhqsystem/zhq


    真能搞笑,自己试试吧,代码肯定不对。
作者: Rasm    时间: 2017-1-5 10:56

回复 2# flyinnet9


    已经成功导出到新文本,

请教,如何删除纯数字和纯字母呢,因为我只想要字母+数字的内容
作者: flyinnet9    时间: 2017-1-5 11:40

回复 9# Rasm
  1. @echo off
  2. (for /f "tokens=1-2 delims=|" %%a in (a.txt) do (
  3.   for /f "delims=0123456789" %%c in ("#%%b") do if not "%%c"=="#" if not "%%c"=="#%%b" echo.%%a^|%%b
  4. ))>result.txt
  5. pause
复制代码

作者: shmily    时间: 2017-1-7 23:41

回复 9# Rasm
导出来少了一行。
第13行应该是要的吧?
作者: CrLf    时间: 2017-1-7 23:50

  1. findstr /v "[^|0-9 ][0-9]* *$" a.txt
复制代码

作者: Nsqs    时间: 2017-1-8 01:07

  1. :On Error Resume Next
  2. :set fso=CreateObject("scripting.filesystemobject")
  3. :Sub class_bat
  4. echo off&cls
  5. cscript -nologo -e:vbs "%0"
  6. pause
  7. Exit Sub
  8. :End Sub
  9. set RegExp=new RegExp
  10. RegExp.IgnoreCase=-1:RegExp.Global=-1:regexp.multiline=-1
  11. file="a.txt"
  12. RegExp.Pattern=".*\|([^a-z]*|[^0-9]*)$"
  13. var=fso.opentextfile(file).readall
  14. var=RegExp.Replace (var,"")
  15. RegExp.Pattern="^.*[^\n]$"
  16. set matches=regexp.execute(var)
  17. for each match in matches
  18. result=result&match&vbcrlf
  19. next
  20. result=left(result,len(result)-2)
  21. fso.createtextfile("new.txt").write result
  22. wsh.echo result
复制代码

作者: Rasm    时间: 2017-1-13 00:45

回复 10# flyinnet9


    转换下,一样的,文本,如果是 | 右边只保留纯数字呢,该怎么修改代码
作者: flyinnet9    时间: 2017-1-13 10:33

本帖最后由 flyinnet9 于 2017-1-13 10:34 编辑

有字符的另算
  1. 纯数字
  2. findstr "|[0-9]*$" a.txt
  3. 纯字母
  4. findstr "|[^0-9]*$" a.txt
  5. 非纯数字
  6. findstr /v "|[0-9]*$" a.txt
  7. 非纯字母
  8. findstr /v "|[^0-9]*$" a.txt
  9. 数字和字母
  10. findstr /v "|[0-9]*.$" a.txt |findstr /v "|[^0-9]*.$"
复制代码

作者: win.BAT    时间: 2017-1-13 14:41

回复 1# Rasm

老旧DZ 齿问题了
删除|右边数字列
cat a
jhfgudeli|wodima123
jhfgudeli|jhfgudeli
jhfgudeli|7204381
jest1314527|1314527
jeffnomms|fanzhe128
jaychen3326|wfd901215
jaychen3326|123456
jasonlouhao|jasonlouhao
jasonlouhao|asd138
jasonlee123|jasonlee123
jasonlee123|19880918
jasonlee123|123123
jaskjay|63619063qw
awk -F "|" '$2!~ /^[0-9]+$/'  a
应得结果
jhfgudeli|wodima123
jhfgudeli|jhfgudeli
jeffnomms|fanzhe128
jaychen3326|wfd901215
jasonlouhao|jasonlouhao
jasonlouhao|asd138
jasonlee123|jasonlee123
jaskjay|63619063qw
作者: Rasm    时间: 2017-1-14 00:14

回复 15# flyinnet9


   按照你第一次写代码,该如何修改呢
作者: Rasm    时间: 2017-1-21 15:11     标题: 批处理如何批量删除纯数字所在的行数?

jhfgudeli|wodima123
jhfgudeli|jhfgudeli
jhfgudeli|7204381
jest1314527|1314527
jeffnomms|fanzhe128
jaychen3326|wfd901215


“|”右侧只要是纯数字的,整行删除,“123123fa” 这种不要删除掉哦
作者: 老刘1号    时间: 2017-1-21 20:26

本帖最后由 老刘1号 于 2017-1-22 16:55 编辑
  1. Echo off&cls
  2. >输出.txt (
  3. FOR /f "delims=^| tokens=1,*" %%a in (文本.txt) do (
  4.     echo.%%b|(Findstr /i "a b c d e f g h i j k l m n o p q r s t u v w x y z")1>nul 2>&1&&Echo.%%a^|%%b
  5. ))
复制代码
出了点小问题,改下……
这回真改了……
作者: Nsqs    时间: 2017-1-22 02:43

本帖最后由 Nsqs 于 2017-1-22 04:45 编辑

方法1
  1. ' 2>nul &cls&(type "1.txt"|cscript -nologo -e:"vbs" "%~0")>new.txt&exit
  2. set ws=wsh.stdin:set regexp=new regexp
  3. with regexp
  4.     do
  5.         .global=-1:.pattern="^.+\|\d*$"
  6.         read=ws.readline
  7.         if not .test(read) then wsh.echo read
  8.     loop until ws.atendofstream
  9. end with
复制代码
方法2
  1. @echo off&setlocal enabledelayedexpansion
  2. (for /f "tokens=1-2 delims=|" %%1 in (1.txt)do (
  3. set /a n=%%2
  4. if !n! equ 0 echo %%1^|%%2
  5. ))>new.txt 2>nul
复制代码

作者: CrLf    时间: 2017-1-22 11:05

  1. findstr /v "\|[0-9][0-9]*$" 1.txt >new.txt
复制代码

作者: Nsqs    时间: 2017-1-22 15:15

回复 4# CrLf


    这个正则写法有问题,有的数字没有剔除
作者: 老刘1号    时间: 2017-1-22 16:55

回复 2# 老刘1号


    ……题目看错,我处理了一通左侧的……
作者: 老刘1号    时间: 2017-1-22 16:59

回复 4# CrLf


    [attach]10397[/attach]
作者: zz100001    时间: 2017-1-22 17:28

哎哟,版主一出手就有美女加分,隔壁老刘就没这待遇啊
作者: pcl_test    时间: 2017-1-22 18:05

回复 7# 老刘1号

最后结尾处的没有排除是因为没有换行或是有空白字符,所以findstr没有匹配到
  1. powershell "gc '文本.txt'|?{$_ -notmatch '\|\d+\s*$'}"&pause
复制代码

作者: capslock    时间: 2017-1-23 12:00

回复 26# zz100001


    你怎么知道我是女的, 加分是随机的haha, 给老刘1号也补上了
作者: Rasm    时间: 2017-1-23 20:49

回复 20# 老刘1号


    如果一个文本中,只想删选出右侧:123dfsajo,数字开头,但是里面有字母+数字的,该怎么修改
作者: 老刘1号    时间: 2017-1-23 21:05

我说嘛我原来是1楼被挤到20楼了……
作者: Rasm    时间: 2017-1-23 21:14

回复 31# 老刘1号


    对啊,合并了,哈哈,问题雷同
作者: Rasm    时间: 2017-1-23 21:29

回复 20# 老刘1号


    这个代码是对了,140Kb的文本,处理了2分钟
作者: 老刘1号    时间: 2017-1-23 22:17

回复 33# Rasm


    不知道有红包奖励没(我只想吃个雪糕)
作者: Rasm    时间: 2017-1-26 17:44

回复 34# 老刘1号


    送你个敬业福
作者: 老刘1号    时间: 2017-1-26 20:38

回复 35# Rasm


    已经集齐了
作者: Rasm    时间: 2017-1-31 21:59

回复 2# flyinnet9


    123adfa

这种也是字母+数字的被过滤了,该怎么加进去
作者: CommandBatCmd    时间: 2017-2-1 00:29

回复 34# Rasm


    使用gawk,简单高效,删除纯数字和纯字母,只保留字母+数字的行。
  1. @echo off
  2. gawk -F"|" "BEGIN{IGNORECASE=1}$2~/[0-9][A-Z]|[a-z][0-9]/" 文本.txt>输出.txt
  3. pause
复制代码
使用纯P,代码稍微多点,删除纯数字和纯字母,只保留字母+数字的行。
  1. @echo off
  2. (for /f "tokens=1,2* delims=|" %%a in (文本.txt) do (
  3.     for /f "tokens=1,2* delims=0123456789" %%c in ("#%%b") do (
  4.         if not "%%c%%d"=="#" (
  5.             for /f "tokens=1,2* delims=abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ" %%A in ("#%%b") do (
  6.                 if not "%%A%%B"=="#" echo,%%a^|%%b
  7.             )
  8.         )
  9.     )
  10. ))>输出.txt
  11. pause
复制代码





欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2