Board logo

标题: [文件操作] 【已解决】小白求教bat如何处理字符段长度 [打印本页]

作者: lanmao0712    时间: 2021-1-30 12:31     标题: 【已解决】小白求教bat如何处理字符段长度

本帖最后由 lanmao0712 于 2021-1-31 13:54 编辑

如图,现有上千个类似文件需要处理,去除每行字符长度超过10的,用什么命令可以去除,大佬们赐教
作者: flashercs    时间: 2021-1-30 19:02

  1. @echo off
  2. @REM 处理当前目录的文件,删除大于10个字符的行,将处理结果放到output目录。
  3. cd /d "%~dp0"
  4. set outdir=.\output
  5. for /f "delims=" %%A in ('dir /a-d /b *.txt') do (
  6.   >"%outdir%\%%~nxA" findstr /rbv "............*"
  7. )
  8. pause
  9. exit /b
复制代码

作者: netdzb    时间: 2021-1-30 20:31

回复 2# flashercs

这个用sed第三方工具怎么处理啊?
作者: Batcher    时间: 2021-1-30 20:42

回复 3# netdzb
  1. sed -r -i "/.{11}/d" *.txt
复制代码

作者: netdzb    时间: 2021-1-30 21:16

回复 4# Batcher

sed -r -i "/.{11}/d" *.txt

上面的正则{11}表示什么意思?为什么editplus

^.{10,}$ ===> 空
\n ===> 空

需要2次才能完成任务。

我刚才试验了这个命令

sed -r -i "/.{11,}/d" *.txt和你的命令操作是否一样?

再次请教,谢谢!
作者: Batcher    时间: 2021-1-30 21:23

回复 5# netdzb


http://www.gnu.org/software/sed/manual/sed.html#BRE-syntax

\{i\}
As *, but matches exactly i sequences (i is a decimal integer; for portability, keep it between 0 and 255 inclusive).

\{i,j\}
Matches between i and j, inclusive, sequences.

\{i,\}
Matches more than or equal to i sequences.
作者: netdzb    时间: 2021-1-30 21:46

回复 4# Batcher


sed命令,我还有个问题,就是不用sed命令自带的d来删除行。

改成匹配除了(回车\n)的任意10个以上的字符,以回车结束的字符串,替换为空,这样的sed命令怎么写?
作者: lanmao0712    时间: 2021-1-31 01:16

本帖最后由 lanmao0712 于 2021-1-31 01:23 编辑

回复 2# flashercs                                                                                                                            
运行后一直没反应,for /f "delims=" %%A in ('dir /a-d /b *.txt') do (>"%outdir%\%%~nxA" findstr /rbv "............*"这个最后的*是做什么的?
还有些文件里面内容的-是英文符号.这个会不会有影响呢
作者: flashercs    时间: 2021-1-31 07:18

回复 8# lanmao0712


    这么大文件 那用4楼代码,论坛下载sed.exe,4楼代码是直接替换原文件。
作者: netdzb    时间: 2021-1-31 09:38

本帖最后由 netdzb 于 2021-1-31 09:47 编辑

回复 9# flashercs


是不是这样写就可以了?
\[^\n]{10,}\n  ===> 空
换成命令是这样的
sed -r -i "/[^\n]{10,}\n//" *.txt
作者: qixiaobin0715    时间: 2021-1-31 09:56

  1. @echo off
  2. md newfiles
  3. setlocal enabledelayedexpansion
  4. for %%a in (*.txt) do (
  5.     (for /f "usebackq delims=" %%b in ("%%a") do (
  6.         set "str=%%b"
  7.         if "!str:~10!"=="" echo,%%b
  8.     ))>newfiles\%%a
  9. )
  10. pause
复制代码

作者: Batcher    时间: 2021-1-31 09:59

回复 10# netdzb


    不是。你亲自一试便知。
作者: qixiaobin0715    时间: 2021-1-31 10:02

回复 5# netdzb
editplus一次替换
^.{10,}\n
作者: netdzb    时间: 2021-1-31 10:20

回复 12# Batcher


  我的意思是想匹配10个以上非回车换行的任意字符加上末尾的回车,替换为空。

改成这样就可以了吗?
  sed -r -i "/[^\n]{10,}$\n//" *.txt
作者: Batcher    时间: 2021-1-31 10:32

回复 14# netdzb


    你自己测试的时候成功了吗?
作者: netdzb    时间: 2021-1-31 10:33

回复 15# Batcher


有没有在线测试的平台,我是手机无法测试。
作者: netdzb    时间: 2021-1-31 11:12

回复 13# qixiaobin0715






0000102v02v02v02vsf-poe
0000469-poe
0000c2-poe
0000vO2vO2vO2vO2vO2vwv-poe
00022vip-poe
0003vwv-poe
0005vO2vO2vO2vwv-poe
0006vwv-poe
0007vwv-poe
0008vwv-poe
00099bet-poe
OOOlecai-poe
0024vipl0-poe
abcde

测试了editplus运行结果不对,是上面的结果。
作者: netdzb    时间: 2021-1-31 11:24

本帖最后由 netdzb 于 2021-1-31 11:29 编辑

回复 15# Batcher

刚才测试了,命令直接报错。
我的代码是不是应该写成下面这种形式,但表达式里面有正则总也写不对啊。
sed -i s/wav/flac/g "%%x"
作者: qixiaobin0715    时间: 2021-1-31 11:33

回复 17# netdzb
用EE测试结果如下:
作者: netdzb    时间: 2021-1-31 11:41

本帖最后由 netdzb 于 2021-1-31 11:42 编辑

回复 19# qixiaobin0715

你的EE是老版本吗?我用过试用期过了。
作者: Batcher    时间: 2021-1-31 14:00

回复 18# netdzb


不是。sed命令处理文本的方式跟你想象中的方式不一样。跨行处理一般是类似这样的操作:
http://bbs.bathome.net/thread-57708-1-1.html#pid235591




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2