标题: [原创] [批处理命令一日一教学 续](13)字符串查找增强:findstr [打印本页]
作者: Hello123World 时间: 2011-11-14 15:47 标题: [批处理命令一日一教学 续](13)字符串查找增强:findstr
【原】[一日一教学]批处理系列帖子索引 http://bbs.bathome.net/thread-2576-1-1.html
【续】[一日一教学]批处理系列帖子索引 http://bbs.bathome.net/thread-13798-1-1.html
帮助信息:- 在文件中寻找字符串。
-
- FINDSTR [/B] [/E] [/L] [/R] [/S] [/I] [/X] [/V] [/N] [/M] [/O] [/P] [/F:file]
- [/C:string] [/G:file] [/D:dir list] [/A:color attributes] [/OFF[LINE]]
- strings [[drive:][path]filename[ ...]]
-
- /B 在一行的开始配对模式。
- /E 在一行的结尾配对模式。
- /L 按字使用搜索字符串。
- /R 将搜索字符串作为正则表达式使用。
- /S 在当前目录和所有子目录中搜索匹配文件。
- /I 指定搜索不分大小写。
- /X 打印完全匹配的行。
- /V 只打印不包含匹配的行。
- /N 在匹配的每行前打印行数。
- /M 如果文件含有匹配项,只打印其文件名。
- /O 在每个匹配行前打印字符偏移量。
- /P 忽略有不可打印字符的文件。
- /OFF[LINE] 不跳过带有脱机属性集的文件。
- /A:attr 指定有十六进位数字的颜色属性。请见 "color /?"
- /F:file 从指定文件读文件列表 (/ 代表控制台)。
- /C:string 使用指定字符串作为文字搜索字符串。
- /G:file 从指定的文件获得搜索字符串。 (/ 代表控制台)。
- /D:dir 查找以分号为分隔符的目录列表
- strings 要查找的文字。
- [drive:][path]filename
- 指定要查找的文件。
-
- 除非参数有 /C 前缀,请使用空格隔开搜索字符串。
- 例如: 'FINDSTR "hello there" x.y' 在文件 x.y 中寻找 "hello" 或
- "there"。'FINDSTR /C:"hello there" x.y' 文件 x.y 寻找
- "hello there"。
-
- 正则表达式的快速参考:
- . 通配符: 任何字符
- * 重复: 以前字符或类出现零或零以上次数
- ^ 行位置: 行的开始
- $ 行位置: 行的终点
- [class] 字符类: 任何在字符集中的字符
- [^class] 补字符类: 任何不在字符集中的字符
- [x-y] 范围: 在指定范围内的任何字符
- \x Escape: 元字符 x 的文字用法
- \<xyz 字位置: 字的开始
- xyz\> 字位置: 字的结束
-
- 有关 FINDSTR 常见表达法的详细情况,请见联机命令参考。
复制代码
这则帮助信息中,我将“一般表达式”,全部替换成了“正则表达式”(一切都是机器翻译惹的祸)。
命令概括:
findstr,全英文find string,意为“查找字符串”;
/b,全英文begin,意为“开始”;
/e,全英文end,意为“末端”;
/l,literally,意为“照字面地”;引申为“去正则表达式”。
/r,regular,意为“有规律的”;引申为“正则表达式”。
/s,subdirectory,意为“子目录”;
/i,ignore,意为“忽略”;引申为“忽略大小写”;
/x,exactly,意为“恰好地”;引申为“完全匹配”;(一开始意为不是这个单词,不过HAT确实高明——之所以以e为缩写,是因为前面有了end的缩写,所以以第二个字母x为缩写)。
/v,invert,意为“反转、使颠倒”(感谢doupip的单词提供);
/n,全英文number,意为“数字”;引申为“行号”;
/m,merely,意为“只是”;
/o,offset,意为“偏移”;
/p,print,意为“打印”;
/off[line],意为“脱机文件”;
/a,attribute,意为“属性”;
/f,file,意为“文件”;
/c,case,意为“把几个字加起来”;引申为“全部字匹配”;
/g,get,意为“获得”;
/d,directory,意为“目录”;
class,类。
感谢HAT的单词提供。
感谢weichengxiehou。
参数详解部分13-14节都是从weichengxiehou的帖子里复制来的(既然有现成了,省心多少),原帖地址。
参数详解:
学习findstr需要大量的实践体会,所以需要新建一些txt文本以供测试。
a.txt的内容(a.txt的内容在后面会多次修改,请注意!):- Hello World
- Hello Boy
- hello ,good man.
- goodbye!
复制代码
1.最简单的应用:在指定文本中查找指定字符串
代码:复制代码
结果:- C:\Users\helloworld\Desktop>findstr "hello" a.txt
- hello ,good man.
复制代码
代码:复制代码
结果:- C:\Users\helloworld\Desktop>findstr "Hello" a.txt
- Hello World
- Hello Boy
复制代码
这里可以看出,findstr默认是区分大小写的(跟find命令一样)——找hello就不会出现Hello,反之亦然。
怎么让其不区分大小写呢?
用/i参数!
例如:- C:\Users\helloworld\Desktop>findstr /i "Hello" a.txt
- Hello World
- Hello Boy
- hello ,good man.
复制代码
2.显示要查找的字符具体在文本哪一行
代码:- C:\Users\helloworld\Desktop>findstr /n /i "hello" a.txt
复制代码
效果:- 1:Hello World
- 2:Hello Boy
- 3:hello ,good man.
复制代码
显示的结果中冒号(:)是英文格式下的,在用for提取的时候需要注意!
这里可以对比一下find命令的/n参数:
代码:- C:\Users\helloworld\Desktop>find /n "hello" a.txt
复制代码
效果:- ---------- A.TXT
- [3]hello ,good man.
复制代码
冒号(:)和中括号([]),这就是差别,编写代码的时候一定要注意。
3.查找包含了指定字符的文本
代码:- C:\Users\helloworld\Desktop>findstr /m /i "hello" *.txt
复制代码
效果:复制代码
1.txt中的类容如下:- 除非参数有 /C 前缀,请使用空格隔开搜索字符串。
- 例如: 'FINDSTR "hello there" x.y' 在文件 x.y 中寻找 "hello" 或
- "there"。'FINDSTR /C:"hello there" x.y' 文件 x.y 寻找
- "hello there"。
复制代码
由于加上了/m参数,所以只列出包含指定字符的文件名。
4.查找以指定字符开始或结尾的文本行
这个功能和前面介绍的最大不同就在于涉及到了“元字符”,如果你不明白什么是“元字符”,那也不用担心学不好这一节,这就好像不明白“water”是什么,也不会影响喝水。
a.txt内容:- good hello
- 你好 hello world
- Hello World
- Hello Boy
- hello ,good man.
- goodbye!
复制代码
如何查找以hello(忽略大小写)开始的行?
两种方法:
①./b参数
代码:- C:\Users\helloworld\Desktop>findstr /b /i "hello" a.txt
复制代码
效果:- Hello World
- Hello Boy
- hello ,good man.
复制代码
good hello 和 你好 hello world,这两行都没有显示出来,因为hello不在行的开始处。
②.^符
这里的^可不是转义符,而是正则表达式中的“匹配行开始的位置”。
代码:- C:\Users\helloworld\Desktop>findstr /i "^hello" a.txt
复制代码
效果:- Hello World
- Hello Boy
- hello ,good man.
复制代码
学完了以查找指定字符开始的行,下面学习查找以指定字符结尾的行。
如何查找以hello(忽略大小写)结尾的行?
同样有两种方法:
①./e参数
代码:- C:\Users\helloworld\Desktop>findstr /e /i "hello" a.txt
复制代码
结果:复制代码
只显示了“good hello”,因为其它行虽然有“hello”,但是他们都没有以“hello”结尾。
②.$符
代码:- C:\Users\helloworld\Desktop>findstr /i "hello$" a.txt
复制代码
结果:复制代码
到此,我们已经学习了两个正则表达式的元字符:^和$(分别和他们功能相对应的有/b、/e参数)。
5.查找与指定字符完全匹配的行
首先修改a.txt的内容:- hello
- hello hello
- good hello
- 你好 hello world
- Hello World
- Hello Boy
- hello ,good man.
- goodbye!
复制代码
懂得举一反三的的童鞋可能会试着尝试以下代码:- C:\Users\helloworld\Desktop>findstr /n /i "^hello$" a.txt
复制代码
结果让你倍感欣喜:复制代码
其实除了这一种方法外,findstr命令还提供了/x参数用来查找完全匹配的行。
代码:- C:\Users\helloworld\Desktop>findstr /n /i /x "hello" a.txt
复制代码
结果:复制代码
.
6.关闭正则表达式会怎么样?
我们可以人为地将findstr分为两种模式,“正则表达式模式”和“普通字符串模式”。
findstr默认为“正则表达式模式”,加上/r参数也是“正则表达式模式”此说法不太准确→(换言之,/r参数有点多余)。
2021-01-11 补充:
加上/l参数后,findstr转换为“普通字符串模式”(其实find就是这种模式、且只有这种模式)。
“普通字符串模式”下,以同样的代码,看看结果怎样?
代码:- C:\Users\helloworld\Desktop>findstr /li "^hello" a.txt
复制代码
结果什么都没显示出来。
以hello开头的行明明有以下这些,为什么没显示出来呢?- hello hello
- Hello World
- Hello Boy
- hello ,good man.
复制代码
因为,当你使用“普通字符串模式”,findstr不会把^当做是正则表达式的元字符,而只是把其当做普通字符^,也就是说它此时已经不具备“表示行首”的功能,变成了和h之类字符一样的普通民众,再也没“特权”。
改变a.txt的内容:- ^hello
- hello
- hello hello
- good hello
- 你好 hello world
- Hello World
- Hello Boy
- hello ,good man.
- goodbye!
复制代码
再次运行代码:- C:\Users\helloworld\Desktop>findstr /nli "^hello" a.txt
复制代码
结果:复制代码
.
7.查找不包含指定字符的行
如果比较一下find和findstr命令就会发现,他们都具有/v,/n,/i,/off[line]参数,而且功能都是一摸一样的,这里说的就是/v参数。
查找不包含hello的行。
代码:- C:\Users\helloworld\Desktop>findstr /vni "hello" a.txt
复制代码
结果:复制代码
.
8.如何查找当前目录及子目录下文件内容中包含某字符串的文件名?
在写这篇教程的时候,偶然看到有批友问了这个问题,问题地址:http://bbs.bathome.net/viewthread.php?tid=14727
代码:复制代码
效果:
找出当前目录及子目录下文件内容中包含“专业”的文本文件,并只显示其文件名。
9.用文本制定要查找的文件 And 用文本制定要查找的字符串
用文本制定要查找的文件
新建一个file.txt,内容如下(这个文本中指定findstr要查找的文本的路径):- C:\Users\helloworld\Desktop\1.txt
- C:\Users\helloworld\Desktop\a.txt
- C:\Users\helloworld\Desktop\clip.txt
- C:\Users\helloworld\Desktop\CrLf 批处理笔记.txt
- C:\Users\helloworld\Desktop\file.txt
- C:\Users\helloworld\Desktop\MyRarHelp.txt
- C:\Users\helloworld\Desktop\test.txt
- C:\Users\helloworld\Desktop\红楼.txt
- C:\Users\helloworld\Desktop\520\新建文本文档.txt
- C:\Users\helloworld\Desktop\520\12\hello_ world.txt
- C:\Users\helloworld\Desktop\编程\help.txt
- C:\Users\helloworld\Desktop\编程\win7 help比xp help多出来的命令.txt
- C:\Users\helloworld\Desktop\编程\wmic.txt
复制代码
.
代码:- C:\Users\helloworld\Desktop>findstr /f:file.txt /im "hello"
复制代码
效果:- C:\Users\helloworld\Desktop\1.txt
- C:\Users\helloworld\Desktop\a.txt
- C:\Users\helloworld\Desktop\CrLf 批处理笔记.txt
- C:\Users\helloworld\Desktop\file.txt
- C:\Users\helloworld\Desktop\test.txt
复制代码
.
用文本制定要查找的字符串
新建一个string.txt,内容如下(这个文本中指定findstr要查找的字符串):复制代码
.
a.txt- ^hello
- hello
- hello hello
- good hello
- 你好 hello
- Hello World
- Hello Boy
- hello ,good man.
- goodbye!
复制代码
代码:- C:\Users\helloworld\Desktop>findstr /ig:string.txt a.txt
复制代码
效果:- hello
- hello hello
- Hello World
- Hello Boy
- hello ,good man.
复制代码
.
被忽略的行- ^hello
- good hello
- 你好 hello
- goodbye!
复制代码
.
从被忽略的“^hello”可以看出,在不加/l参数的前提下,用/g指定的搜索字符串中如果含有“元字符”,则作为正则表达式使用,而不是作为普通表达式。
10.搜索一个完全匹配的句子
其实findstr自带的帮助中就有个很好的例子:
例如: 'FINDSTR "hello there" x.y' 在文件 x.y 中寻找 "hello" 或
"there"。'FINDSTR /C:"hello there" x.y' 文件 x.y 寻找
"hello there"。
可以以这个例子来做个测试。
a.txt- hello there
- hellothere
- hello
- there
复制代码
.
代码:- C:\Users\helloworld\Desktop>findstr /ic:"hello there" a.txt
复制代码
结果:复制代码
这就是句子的完全匹配了。
11.搜索一个完全匹配的词。
这里也涉及到了两个元字符:\<,\>。
先试看一个例子。
a.txt- far there
- farthere
- there
- far
- farm
- farmer
复制代码
.
代码:- C:\Users\helloworld\Desktop>findstr "far" a.txt
复制代码
结果:- far there
- farthere
- far
- farm
- farmer
复制代码
.
我的本意是要查找含有“far”这个单词的行,但是farthere、farm、farmer却显示出来了,这不是我想要的结果。
如果只要求显示含有“far”这个单词的行,该怎么写呢?
代码:- C:\Users\helloworld\Desktop>findstr "\<far\>" a.txt
复制代码
结果:复制代码
.
12.指定要查找的目录
/d参数我一直把它和/f、/g归为一类,但其实二者截然不同,/f、/g是用文本文件制定要查找的文件、字符串,而/d是直接书写目录名到命令中。
代码:- C:\Users\helloworld\Desktop>findstr /imd:520;编程; ".*" "*.txt"
复制代码
结果:- 520:
- hello.txt
- 编程:
- help.txt
- win7 help比xp help多出来的命令.txt
- wmic.txt
复制代码
查找在520、编程目录中所有包含任意字符的txt文件。
13.统计字符数
/o:在每行前打印字符偏移量,在找到的每行前打印该行首距离文件开头的位置,也就是多少个字符,如test.txt中有如下内容:- aaaaaaaaaa
- aaaaaaaaaa
- aaaaaaaaaa
- aaaaaaaaaa
- aaaaaaaaaa
- aaaaaaaaaa
复制代码
执行命令:复制代码
::上一行中的.*为正则表达式的内容,表示任意行,包含空行
结果如下:- 0:aaaaaaaaaa
-
- 12:aaaaaaaaaa
-
- 24:aaaaaaaaaa
-
- 36:aaaaaaaaaa
-
- 48:aaaaaaaaaa
复制代码
注意每行末尾的回车换行符算两个字符。
14.以指定颜色显示文件名
/a:当被搜索文件名中含有通配符*或?时对搜索结果的文件名部分指定颜色属性,具体颜色值参见color帮助:
0 = 黑色 8 = 灰色
1 = 蓝色 9 = 淡蓝色
2 = 绿色 A = 淡绿色
3 = 浅绿色 B = 淡浅绿色
4 = 红色 C = 淡红色
5 = 紫色 D = 淡紫色
6 = 黄色 E = 淡黄色
7 = 白色 F = 亮白色
常用于彩色显示,举个简单的例子,想要彩色显示“批处理之家”怎么办,假如当前的color设置为27(背景绿色,字体白色),用蓝色显示“批处理之家”咋办?::下一行的退格符可以在cmd的编辑模式下按ctrl+p后按退格键获得- >"批处理之家" set /p=<nul
-
- findstr /a:21 .* "批处理之家*"
-
- pause
复制代码
代码中的退格符是为了让显示的内容仅为"批处理之家",如果有其他内容,在彩色显示的"批处理之家"后还有一个冒号和其他内容,退格符正好将冒号删除。注意代码中的通配符是必须的。
15.findstr中的元字符
[attach]6887[/attach]
16.未讲解的内容:/p,/off[line]
这两个命令不明白是什么意思,因为不知道什么是“不可打印字符”、“带有脱机属性集的文件”,望有识之士给予解答。
扩展阅读:
1.什么是正则表达式:http://zh.wikipedia.org/zh/%E6%A ... 8%E8%BE%BE%E5%BC%8F
2.正则表达式30分钟入门教程(非常好的教程,极力推荐):http://deerchao.net/tutorials/regex/regex.htm
作者: CrLf 时间: 2011-11-14 17:13
大工程...
作者: HAT 时间: 2011-11-14 23:08
/L Uses search strings literally.
/R Uses search strings as regular expressions.
/X Prints lines that match exactly.
作者: wankoilz 时间: 2011-12-1 07:22
好文,顶一个!
作者: bingxing8000 时间: 2011-12-1 08:08
非常棒,好好学习。
作者: doupip 时间: 2011-12-23 10:19
本帖最后由 doupip 于 2011-12-23 10:31 编辑
楼主辛苦~复制代码
/v参数也是一个通用项.英文表达是invert-match 即反选,反转匹配模式 =select non-matching
在linux中的许多命令中也适用,只不过linux中是严格区分大小分,此参数用的是-V- /c,case,意为“把几个字加起来”;引申为“全部字匹配”;
复制代码
/c:string Uses specified string as a literal search string. 如果要用英文单词来帮助记忆的话,我觉得是character string更合适.
作者: yyykkkyyyy 时间: 2011-12-24 23:02
我来学习的同时,把我摸索出的一点 /r 应用说一下 :
看到/c 参数 很容易知道——如果希望查找匹配项是含空格的一串字符,而不是分别匹配空格分隔的多项,可以加/c: 如- echo a bc|findstr/c:"a bc"
复制代码
可是必须空格数也要准确一致,如果希望能匹配字符串中含不定数目的空格呢?/r 就发挥作用了- echo a bc|findstr/rc:"a\ *b"
复制代码
作者: cjiabing 时间: 2011-12-30 19:22
其他的不是很难,关键是正则表达式这里最好多点例子。
作者: Hello123World 时间: 2011-12-30 23:04
回复 7# yyykkkyyyy - echo a bc|findstr/rc:"a\ *b"
复制代码
这个确实是意料之外的,那本《正则表达式入门经典》信誓旦旦的说“即使不指定/r,这也是默认行为”——其它测试这个说法是没问题的,但在空格这点上确实加了/r才会有结果。
莫非猫腻在“\”这个特殊的转义符?
作者: Hello123World 时间: 2011-12-30 23:12
我明白了!不在于“\”这个符号,“即使不指定/r,这也是默认行为”也没有错,关键是/c的特性——将字符链接起来,有去正则表达式的效果。
证明:
Findstr ".*" 1.txt
显示所有1.txt中的内容
Findstr /c:".*" 1.txt
什么也不显示,因为1.txt中没有包含“.*”的项。
作者: HAT 时间: 2011-12-30 23:22
回复 8# cjiabing
正则表达式简介
http://www.bathome.net/thread-4485-1-1.html
批处理findstr命令正则表达式的基本用法
http://www.bathome.net/thread-24-1-1.html
作者: cjiabing 时间: 2012-4-16 22:55
在处理一些字符(比如有时候是中文,没有总结)时,用findstr /r 或findstr /l 试试。
作者: xhhivi 时间: 2012-4-16 23:43
感谢出了续集,学习下
作者: clonecd 时间: 2012-5-16 14:21
支持了,我很久到这里看看了。
作者: baihaijiao101 时间: 2013-3-1 19:18
find "\<XXX\>" xxx.txt查找字符串的时候会将特殊字符(非字母数字)视为合法,如xx.txt内容为:
hello&%$+
hello world
helloworld
执行命令:findstr /i "\<hello\>" 123.txt
结果为:
hello&%$+
hello world
感觉这两个元字符确实有些不足呀!
作者: baihaijiao101 时间: 2013-3-1 19:48
统计的偏移量是包含结果中统计值所占的偏移量的,如第一行其实没有字符,结果为0:,占了两个偏移量,第二行有个空格, 结果中第二行占了三个偏移量,所以第三行统计的偏移量为2+3等于5
不知道这样理解正解否?
作者: ryusyou 时间: 2013-3-7 10:52
支持了,学习下
作者: lateol 时间: 2013-3-12 13:08
强悍啊 学习学习
作者: xuhuoren 时间: 2013-4-3 21:51
findstr是不是对正则表达式的支持不完全啊,有些元字符貌似不支持啊?
作者: xuhuoren 时间: 2013-4-3 21:59
回复 7# yyykkkyyyy
是不是可以这么说,在使用/f,/c,/d等参数时,会屏蔽掉字符串的正则性,必须显示声明正则才可以使用正则表达式进行搜索
作者: James_vivi 时间: 2013-10-29 22:07
这符号,看的眼睛都花了,
作者: shelluserwlb 时间: 2014-11-2 00:05
看着很乱 得仔细消化才行。
作者: shelluserwlb 时间: 2014-11-2 00:23
本帖最后由 shelluserwlb 于 2014-11-2 00:28 编辑
回复 17# baihaijiao101
我认为它指的是某一行的首字符相对于第1行首字符的偏移量 ,除第1行首字符偏移量是0外,
其它行数的首字符偏移量=上一行首字符偏移量+上一行字符数(含空格)+2(回车符和换行符)
例如: ---- test1.txt --------
aaaaaa aaaa
aaaa aaaaaa
aaaaaaaa aa
aaaaaaaaaa
--------------------------------
执行命令: findstr /o .* test1.txt
显示结果是:
0: aaaaaa aaaa
16:aaaa aaaaaa
30:aaaaaaaa aa
44:aaaaaaaaaa
作者: hero1997 时间: 2014-12-23 16:24
加上正则立马就复杂了好多,得好好消化消化
作者: s4080209 时间: 2015-1-15 12:04
好好学习学习。。。。有点不太懂。。
作者: duofangpao 时间: 2015-5-8 15:05
我想在多个txt文件中,按照多个关键字查找,(就是说在这个文件中要同时有多个关键字,可以不连续,a关键字在第一行,b关键字在第10行),从出现第一个关键字后,如果遇到空白行就停止。只有从第一个关键字到最后一个关键字都出现,而且中间没有空行,才符合条件,输出文件名。这个怎么实现啊?也不知我表达清楚没?
作者: cjiabing 时间: 2015-5-9 20:49
回复 27# duofangpao
提问请发到讨论版快
作者: 网上邻居 时间: 2016-3-15 13:10
o 为 order,排序。
作者: 秀才 时间: 2019-9-13 17:51
我来学习的同时,把我摸索出的一点 /r 应用说一下 :
看到/c 参数 很容易知道——如果希望查找匹配项是含空 ...
yyykkkyyyy 发表于 2011-12-24 23:02
- echo "abbc" | findstr /rc:"ab*c"
复制代码
这样也可以,看来并不是非要特殊的空格符
作者: 科零仿佛 时间: 2019-10-24 05:44
那个教程说30分钟就能看完,我从下午6点看到晚上10点,让我一度怀疑人生,emmmm
作者: f308ding 时间: 2020-10-27 15:59
你好,我在我的某个目录下测试了这一条findstr /ms "专业" *.txt。发现结果不对,我查找的是doc文件包含的某个词,结果出来的跟实际情况差好远,基本没有显示出来,是怎么回事呢?
作者: qixiaobin0715 时间: 2021-2-21 08:05
回复 1# Hello123World
第13条findstr /o 统计的应当是字节数,不是字符数。如果是存在双字节,应当是+2。
欢迎光临 批处理之家 (http://www.bathome.net/) |
Powered by Discuz! 7.2 |