批处理之家 - Powered by Discuz! Board

标题: [原创] 探讨批处理代码效率 [打印本页]

作者: netbenton 时间: 2009-5-10 23:24 标题: 探讨批处理代码效率

为了处理一些windows不方便做的事情时，我们不得不选择cmd批处理来解决问题，
以逸待劳，来为我们服务。稍有一点了解批处理的都知道，cmd批处理是功能“强大”，但代码运行速度太慢。
于是问题出来了，本来我们选择用cmd批处理的目的是为了更方便和更快速的，可是
cmd批处理的速度和我们期望目标成了矛与盾的较量。
同一个问题批处理的解决办法，往往有多种，不同算法之间的速度相差非常之大，
为了提高cmd批处理程序，算法很关键，于是，都费尽脑汁，想方设法找一些巧妙的
方法。在注重算法的同时，往往忽略了或误解了最基本的问题：“批处理命令的效率”
其实了解批处理命令的效率，有一个良好的BAT编写习惯，可以在为了好的算法
伤脑筋时，少走弯路。我根据在cn-dos所学到的简单总结了一下，欢迎各位指出错误。

声明：
以下仅为个人观点，有兴趣的就看看，并不代表权威数据，
特此声明，以免对大家有误导！

**********
因为不同的电脑速度相差太大，为了能有个统一标准，以@echo off 执行间为0.20毫秒为标准
**********
1. 预处理与运行速度
批处理的预处理已经有多人讨论过了，可以在论坛搜索“预处理”查看。这里就不详述，
只讨论预处理同效率的问题。
其实每行代码真正执行的时间不长（0.01~0.02毫秒），可是单单运行一行代码时，
最少也要0.19毫秒（如：注释行rem），为什么呢？我认为：这应该是批处理的运行的
“预处理”造成的，批处理最好的地方在这里却成了拌脚石，有没有办法解决这个问题呢？
有，把多行命令合成组执行，批处理对组（）内的多行代码一次性预完成的。
（）分组包括If () for () 和直接()，和用&并行，都具有同样的效果，能让系统一次性对多
条指令进行同时预处理，一组命令的用时为：一个预处理时长（0.19毫秒）+每条命令的执行时
长（0.01~0.02毫秒）,也就是越多条命令合成一组，效率越高。for 的效率高的主要原因应该就在这里。
2. 管道操作与运行速度
管道操作对象有：程序（外部命令，三方工具等），内部命令（其实是命令解释器），
设备（空设备nul,标准输入输出设备con,打印设备prn,存储设备即常用的文件）
标准设备输入输出间的转换并不会占用很多时间，只有管道操作的对象为程序和内部命令时，
才会突然加大时间开销，如：
echo a                      0.41毫秒
echo a>>b.txt,    0.30毫秒
echo. a>>b.txt    1,30毫秒  (不知为什么这一点会多用那么多时间)
findstr “aa” a.txt 44.90毫秒
type a.txt |findstr “aa” 99.12毫秒
for /f %%a in (‘set #’) do (rem),  42.70毫秒
echo a|echo b    90.04毫秒
echo aa|findstr .* 88.84毫秒
echo a|sort    89.12毫秒
sort a.txt    45.45毫秒
abcd.com    12.50毫秒 (一个最直接退出的程序，非管道)
可见，程序和命令进行管道操作是需要很大资源的，为什么内部命令进行管道操作也要那么多的时间呢？
如：echo a|echo b
这可能是当前内部命令是不能接收管道数据的，而是调用了另一个命令解释器，再执行其中一个命令，
所以像调用了一个外部程序一样。for /f %%a in (‘command’) do 也应视为一次管道操作，
而使用“|”是进行了双管道操作所以用时多了一半。
3. 子程序调用时，选择文件还是函数
在cmd下，可以使用call :标号来实现子过程调用，这种方法可以把多个子功能集中到一个BAT文件内，
进行内部调用。这种方法可以减少BAT文件的个数，可是要是考虑到效率问题时，
与调用外部BAT文件相比会是怎么样呢？测试结果：
Call :sub 3.51 毫秒
Call abc.bat  1.28 毫秒
出人意料！怎么外部调用会比内部调用更高效呢？？？
4. Call 各种方法中的效率问题
Call 的用法有多种,效率如下：
Call echo %%!n!b%% 1.64毫秒
for %%a in (!n!) do echo !%%ab!  0.63毫秒看来用用for 来取代上句是可以加速度的
Call set aa=%%bb%% 1.47毫秒
Call :sub    3.51  毫秒  (空操作)
Call abc.bat    1.28 毫秒  (空操作)

作者: netbenton 时间: 2009-5-10 23:25 标题: （接一楼）

5. Goto 标号为什么慢呢? 看：
goto :next  0.27毫秒（并不慢）
:next
其实，单个goto 的速度并不是很慢，慢的原因是goto :标号和标号间不支持组合，
也就是每行组指令最少也要0.20毫秒以上。所以通常不应该用goto :标号来构造循环体，
如果一定要这样时，应该把循环体内的多行，用（）或用 “&”进行组合来减少行数。
通常只用在分支，或跳出for 循环。如果不得不用到时，最好用for来辅助以减少循环次数。

6. 注释与也与速度有关吗？
注释方法有两种.
::号
当发现这以用这种方法后，绝大多数人都喜欢上这种方法，因为觉得它基本上不耗时，
其实并非这样，在运行过程中，系统遇到时相当于处理标号一样的时间：0.05毫秒,
其实只要是一行，就算是空行也要0.05毫秒的时间，也就是基本不用时间。
缺点是不能用在命令行后。也不能用在分组（）内
Rem
按道理没有进行作何操作，应该不耗时才对，可是并非如此，单独一行rem要用0.19毫秒，
可见它没有：：注释高效，是否rem该退休了呢？不，实际并非如此，因为它可以用在行后，
和分组（）内，这时它的速度到了0.01~0.02毫秒，这是好多人没有想到的。

7. 外部命令和三方软件的效率问题，文件大少对用时在cmd下相差不是很大，主要是路径的问题，
以直接指明路径最快，在当前路为次，最慢是在%path%路径的最后。三方软件的调用速度是很慢的，
最快操作单个也要12.25毫秒，所以要用到三方的话，尽量在1到3次内完成，不要多次调用三方和外部命令，
特别是不能用在循环体内，除非不得已。这也就是为什么我不想用三方来做界面的原因。
8. 行长与速度，每长30个字符要多用0.01毫秒,因为批处理是一边运行一边解释的，
所以字符串的长短与时间也是有关的。最好是变量名的定义只能要方便看懂，越短越好。

附：（本人对一些命令实测效率，运行1000次所用毫秒数，测试工具请在一楼附件下载）

命令       运行次数    用时(毫秒)
cd.
=== 1000  161
echo.
=== 1000  158
echo.>nul
=== 1000  161
echo.aa>nul
=== 1000  182
echo dd>nul
=== 1000  30
::dir
=== 1000  5
rem dir
=== 1000  19
set aa=aa
=== 1000  21
set /a aa=1
=== 1000  25
set aa=^(3+3^)*1
=== 1000  24
set /a aa=8^^3
=== 1000  25
for /l %%a in (1,1,10) do rem dir
=== 1000  30
for /l %%a in (1,1,100) do set aa=aa
=== 1000  193
for /l %%a in (1,1,10) do set aa=aa
=== 1000  46
if 22==aaa rem dd
=== 1000  21
if 22==aaa set aa=aa
〈〈数据未完，详请看附件〉〉

[ 本帖最后由 netbenton 于 2009-5-11 12:32 编辑 ]

作者: Batcher 时间: 2009-5-10 23:39

cmd批处理是功能“强大”，但代码运行速度太慢

慢和快通常是相对的概念，我们通过怎样的例子来说明批处理运行太慢呢？如果说批处理慢的话，什么东西快呢？

这可能是当前内部命令是不能接收管道数据的，而是调用了另一个命令解释器

据某高人说，系统内部是通过临时文件来实现管道的。

关于各个命令的耗时，你的排版好像有点乱，能否重新整理一下。

作者: Batcher 时间: 2009-5-10 23:43

关于命令的耗时，plp626也做过类似的统计：

xp5.1版的单核，2.4G，256M 测试
方法：for /l %%a in (1 1 %1)do %2 结合timediff 函数计算。

命令                                           效率（次/秒）
--------------------------------------------------------------------------------------------------
echo ...                                        364.3
echo... >1.txt"                            119.3 (只要...是一行,耗时与...长度有关，但差别不明显)
echo ...>nul"                               8772.6
call echo ...>nul                            1204.7
if 1==2 do .....                            61349.7
@echo off                                  71428.6
set d=%x%                               42553.2
set/a n+=1                                  27411.8
call 空+goto:eof                            917.4
goto循环                                     1219.5
shift                                           102040
echo %%a|find >nul                   8474.5
echo %%a|findstr >nul                8474.5
for /f ('more') echo >nul             2806.7
for /f ('type') echo >nul                3932.1
for /f ('findstr .*')  echo >nul       4007.6
for /f ('find /v ""') echo >nul       2966.5
for /f  ( 文件) echo >nul             9807.5
echo.>1.txt                               181.7
echo off>1.txt                         1666.7
del 1.txt                                     1961.7
pushd %tmp%                         2762.4
cd %tmp%                               2808.7
pushd                                        76923.1
for /r (.)是for /f (dir/ad/s)速度的2倍。

频繁生成临时文件时用echo off>tmp效率最高。
call echo ...会大大降低echo 的速度。
多用if判断语句，与goto:eof会提高效率。

原文地址：http://www.cn-dos.net/forum/viewthread.php?tid=39841

作者: netbenton 时间: 2009-5-11 00:07

re 2，3楼：
命令耗时单，在附件里的排是好的，发上来就变了，有兴趣的人可以下载附件来看。

看了一下，plp626 所测试的数据，是以for /l 来实现执行次数，本人认为有误差，
因为for /l 本身也要耗时，另外在for /l 内是进行代码组合了的，并不能了解到因预处理所花的时间

就拿shift 这个命令来说吧，其单条命令应为0.19毫秒，相当于一行rem行的时间，而在组合里面，它用时则仅为0.01毫秒。

而我的方法是，把一千行命令写到一个临时BAT，并在这一千行代码的头尾，加上取数时间命令set aa=%time%
然后调用这个临时BAT来取得运行一千次命令前后的时间。所以误差较小。

[ 本帖最后由 netbenton 于 2009-5-11 00:16 编辑 ]

作者: 随风 时间: 2009-5-11 00:09

把多行命令合成组执行，批处理对组（）内的多行代码一次性预完成的。
（）分组包括If () for () 和直接()，和用&并行

这倒是不知道，学习了。。。。。
对于call我现在简直已经到了痛恨的地步了，不到万不得已是绝不用它的。

[ 本帖最后由随风于 2009-5-11 00:11 编辑 ]

作者: 随风 时间: 2009-5-11 00:22

又一发现分别对 ehco. 和 echo/ 、echo\ 、echo＝、作了测试，发现除了点以外，其余的耗时都和echo 加空格一样。看来以后要改掉用 echo点的习惯才行了。
:loop2
echo=a>nul
echo=a>nul
echo=a>nul
echo=a>nul
echo=a>nul
set /a n+=1
if !n! lss 1000 goto loop2

echo点耗时 23秒，而其它的 5－6秒。。

作者: netbenton 时间: 2009-5-11 00:30

原帖由随风于 2009-5-11 00:22 发表
又一发现分别对 ehco. 和 echo/ 、echo\ 、echo＝、作了测试，发现除了点以外，其余的耗时都和echo 加空格一样。看来以后要改掉用 echo点的习惯才行了。
:loop2
echo=a>nul
echo=a>nul
echo=a>nul
echo=a>nul ...

原来只有点号才会这样呀，我还以为是显示一行多用的时间呢，
这点我倒没有发现！

测试了一下，用echo=dd和echo,dd及echo;dd这三个用时最少为: 0.28毫秒

[ 本帖最后由 netbenton 于 2009-5-11 00:39 编辑 ]

作者: 随风 时间: 2009-5-11 00:35

不知是否和点表示路径有关？
猜想。。。。。

作者: 随风 时间: 2009-5-11 01:07

::号
其实并非这样，在运行过程中，系统遇到时相当于处理标号一样的时间：0.05毫秒,
Rem
按道理没有进行作何操作，应该不耗时才对，可是并非如此，单独一行rem要用0.019毫秒，
可见它没有：：注释高效

这句是不是写错了？
.

Call :sub 1.28毫秒
Call abc.bat 3.51毫秒
出人意料！怎么外部调用会比内部调用更高效呢？？？

还有这句，也写反了吧？
.

Call :abc.bat 1.28毫秒 (空操作)

还有这句是不是多了个冒号？

作者: netbenton 时间: 2009-5-11 07:47 标题: re 楼上

确实写错，已经在一楼更正.
谢谢指正。

作者: netbenton 时间: 2009-6-2 01:31 标题: 在批处理程序设计中，取字符长度最高效的方法

在批处理程序设计中，取字符长度最高效的方法

@echo off&setlocal enabledelayedexpansion
set aav=abcdefghijklmnopqrstuvwxyz不够的话文字也可以ａｂｃｄｅｆｇｈｉｊｋｌｍｎｏｐｑｒｓｔｕｖｗｘｙｚＡＢＣＤＥＦＧＨＩＪＫＬＭＮＯＰＱＲＳＴＵＶＷＸＹＺ
set 最大长度=80
for /l %%a in (0,1,%最大长度%) do (
	set len!aav:~%%a,1!=%%a
	set vva=!aav:~%%a,1!!vva!
)
::前面初始定义一次，后面可以任意使用，只要两个set 就可以取得字符串长度。
::但前提是，你要知道需计算的字符串中，最长字符串的长度。
::效率可想而知了！

set str1=12345678
set str2=abcdefghijklmn

set var1=!str1!!vva!
set var2=!str2!!vva!
set/a var1=len!var1:~%最大长度%,1!,var2=len!var2:~%最大长度%,1!
echo !str1! 长度为：!var1!
echo !str2! 长度为：!var2!
pause
复制代码

作者: 随风 时间: 2009-6-2 01:44

re 12 楼
效率确实高，打破了以前讨论过的 15 位的限制，但应该还有前提，就是ａｖｖ的值不能有重复的吧？

作者: Batcher 时间: 2009-6-2 02:54 标题: 回复 13楼的帖子

“15 位的限制”是指什么？能否给个链接让我学习下？

作者: zqz0012005 时间: 2009-6-2 03:39

什么时候出了这么一个好帖？竟然没注意到。

计算字符串长度，利用临时文件和xcopy，也有一个不错的办法

@echo off
set "str=Hello, bat! %%<^_^>%%""
setlocal enabledelayedexpansion
set str2=!str:y=-!
set str2=!str2:n=-!
set str2=!str2:a=-!
echo;!str2!n>str.tmp
goto:next 用for解析命令输出会降低效率，干脆用临时文件
for /f %%a in ('
    xcopy /-y %SystemRoot%\notepad.exe %SystemRoot%\explorer.exe ^<str.tmp ^| find /i /c "%SystemRoot%\explorer.exe"
') do set strlen=%%a-1
:next
xcopy /-y %SystemRoot%\notepad.exe %SystemRoot%\explorer.exe <str.tmp | find /i /c "%SystemRoot%\explorer.exe" > strlen.tmp
set /p strlen=<strlen.tmp
set /a strlen-=1
echo;!str!&echo/&echo 上面的字符串长度为：!strlen!
del str.tmp strlen.tmp
pause
复制代码

作者: 随风 时间: 2009-6-2 03:49 标题: 回复 14楼的帖子

链接一时找不到了，但还记得代码，是技术组的一位成员发的，在只运行一次set的情况下，最高只能判断15位字符。

:

@echo off
set "var=12345678"
set "str=%var%fedcba9876543210"
set /a max=0x%str:~15,1%
echo %var%  有 %max% 位
pause
复制代码

[ 本帖最后由随风于 2009-6-2 18:12 编辑 ]

作者: 随风 时间: 2009-6-2 03:59

找到了
523066680 在顶楼给出的9位的算法
http://www.bathome.net/viewthrea ... hlight=%D7%D6%B7%FB

15楼 tireless兄将其扩展到了15位
http://www.bathome.net/viewthrea ... =%A1%BE%C1%B7%CF%B0

作者: Batcher 时间: 2009-6-2 04:01 标题: 回复 16楼的帖子

原来是“在只运行一次set的情况下”啊，呵呵，了解了。

作者: zqz0012005 时间: 2009-6-2 06:39 标题: 回复 15楼的帖子

其实不用临时文件的话，效率也不是很低，而且更简洁一些。

@echo off
set "str=例如：Hello, bat! %%<^_^>%%""
setlocal enabledelayedexpansion
set str2=!str:y=-!
set str2=!str2:n=-!
set str2=!str2:a=-!
for /f %%a in ('
    set str2^|xcopy /-y %SystemRoot%\notepad.exe %SystemRoot%\explorer.exe ^| find /i /c "%SystemRoot%\explorer.exe"
') do set /a strlen=%%a-9
echo;!str!&echo/&echo 上面的字符串长度为：!strlen!
pause
复制代码

作者: netbenton 时间: 2009-6-2 13:15

re 13L
是的 a v v 变量字符不能有重复。但是全半角字符都可以，只要不重复任意使用。
此法在计算子串在字符串中的位置很实用。

re 19L
用到临时文件的话这样最简单(按字节计算的）：
set str=任意字符串。
set /p=!str!<nul>len.temp
for %%a in (len.temp) do (echo !str! 长度为：%%~za)
del/q len.temp

作者: zqz0012005 时间: 2009-6-2 14:18 标题: 回复 20楼的帖子

计算字节数方法较多。我的是计算字符个数。

作者: plp626 时间: 2009-6-5 21:23

为了充分保证效率千万不要使用下面两个命令
call echo.....
call set a=...
万不得已要call set n=数字
一定要call set/a n=数字 //这个效率还是很高的是set/a 一半的效率
我发现call set a=... 的执行效率比call子过程还要低10倍以上！

作者: tireless 时间: 2009-6-7 12:28

原帖由 netbenton 于 2009-6-2 01:31 发表
在批处理程序设计中，取字符长度最高效的方法@echo off&setlocal enabledelayedexpansion
set aav=abcdefghijklmnopqrstuvwxyz不够的话文字也可以ａｂｃｄｅｆｇｈｉｊｋｌｍｎｏｐｑｒｓｔｕｖｗｘｙｚＡＢＣＤＥＦ ...

不用把aav倒过来，可以这样：
set str1=12345678
set var1=!aav:~,81!!str1!
set /a var1=len!o:~-81,1!

[ 本帖最后由 tireless 于 2009-6-7 12:29 编辑 ]

作者: cjiabing 时间: 2009-6-7 13:54

我觉得find和findstr是最慢的，好像没都耐心试过这两个查找东东的，发现dir和for比她两还快！~当然for的目录多了它也跑不动，多几个for更是慢。

关于临时文件，有时候你为了看运行结果得用pause和>>，似乎那样代码就没效率了

作者: neorobin 时间: 2009-12-11 06:01 标题: 回复 12楼的帖子

确实是很好的算法, 缺憾是当最大长度很大时, 也会需要很大的变量空间, len后面的标识符可用辅助代码生成无重复的序列

和 23 楼的想法一样, vva 变量是多余的, 我的改法更简明一些, 做个减法就行了

@echo off&setlocal enabledelayedexpansion
set aav=abcdefghijklmnopqrstuvwxyz不够的话文字也可以ａｂｃｄｅｆｇｈｉｊｋｌｍｎｏｐｑｒｓｔｕｖｗｘｙｚＡＢＣＤＥＦＧＨＩＪＫＬＭＮＯＰＱＲＳＴＵＶＷＸＹＺ
set 最大长度=80
for /l %%a in (0,1,%最大长度%) do set /a len!aav:~%%a,1!=最大长度-%%a
::前面初始定义一次，后面可以任意使用，只要两个set 就可以取得字符串长度。
::但前提是，你要知道需计算的字符串中，最长字符串的长度。
::效率可想而知了！

set str1=12345678
set str2=abcdefghijklmn

set var1=!str1!!aav!
set var2=!str2!!aav!
set/a var1=len!var1:~%最大长度%,1!,var2=len!var2:~%最大长度%,1!
echo !str1! 长度为：!var1!
echo !str2! 长度为：!var2!
pause
复制代码

[ 本帖最后由 neorobin 于 2009-12-11 06:14 编辑 ]

作者: 523066680 时间: 2009-12-11 08:36

路过，把老东西不被看好的再贴一次，不要BS我，只因为很久没说话了

@echo off
setlocal enabledelayedexpansion
set str=cn-dos.net
set st2=Str%str%11111111111111111111111111111111111111111111111111111111111111111111111111111111
set "st2=%st2:~0,83%"
set n=!st2:Str%str%=-0!
set /a n=80 %n:1=-1%
echo,%n%
pause
::个数可以是0 范围是0~80 的普通字符串。
复制代码

[ 本帖最后由 523066680 于 2009-12-11 08:37 编辑 ]

作者: newswan 时间: 2021-8-16 17:02

回复 26# 523066680

很好的算法，简单明了

作者: yakeyun 时间: 2021-8-21 18:50

回复 1# netbenton

echo. a>>b.txt 1,30毫秒 (不知为什么这一点会多用那么多时间)
之所以这里时间会多很多，是由于加了点后，相当于创建的文件前面要多一个空格符号。如果在for命令里面，数据多了，将是很恐怖的一个事情，会每一行前面加一个空格符号。

作者: fzp070 时间: 2022-8-21 23:25

感谢分享！学习学习

作者: qixiaobin0715 时间: 2022-8-23 09:21

本帖最后由 qixiaobin0715 于 2022-8-23 09:46 编辑

看了大佬们的代码，真是受益匪浅。
自己也提供一个思路，二分法。下面字符长度限定在1024之内，可根据具体情况自行调整。
由于水平有限，效率不在考虑范围之内：

@echo off
setlocal enabledelayedexpansion
set Var=123456789
set a=512 256 128 64 32 16 8 4 2 1
if defined Var (
    set n=1
    for %%i in (%a%) do (
        if not "!Var:~%%i!"=="" (
            set Var=!Var:~%%i!
            set /a n+=%%i
        )
    )
    echo,!n!
) else (
    echo,Var is not defined
)
pause
复制代码

作者: aloha20200628 时间: 2022-8-23 12:02

看这个十年前的老帖 http://www.bathome.net/thread-11799-1-1.html 可见当年批处理计算字符串长度的"技法峰值"
在此分享源网站 https://www.dostips.com 的这段经典代码(见以下代码段)，其内还有两枚技术硬核》
一。句式 set "str=a!%~1!" 提高形参 %1 的容错率，一网打尽键盘所有可见字符
二。句式 (endlocal ... set /a %~2=%len%) 令局部变量亡前可续命给全局变量

附加几行代码》针对经典代码的测试/用法

@echo off
:[Loop] //测试代码 备注》调用子过程的形参须是变量名
set "str=" &set/p str="输入一个字符串获取其长度："
if not defined str exit/b
(call :strLen str sL)
echo,长度=%sL%
goto[Loop]

:: 分享计算字符串长度的经典代码如下》
::      string [in]  - variable name containing the string being measured for length
::      len [out] - variable to be used to return the string length
:: Many thanks to 'sowgtsoi', but also 'jeb' and 'amel27' dostips forum users helped making this short and efficient
:: Created 20081122，changed 20101116，source https://www.dostips.com
:strLen string len -- returns the length of a string
(   setlocal enabledelayedexpansion
    set "str=a!%~1!" &rem keep the a up front to ensure we get the length and not the upper bound，it also avoids trouble in case of empty string
    set "len=0"
    for /l %%a in (12,-1,0) do (
        set /a "len|=1<<%%a"
        for %%b in (!len!) do if "!str:~%%b,1!"=="" set /a "len&=~1<<%%a"
    )
)
( endlocal & rem return values
    if "%~2" neq "" set /a %~2=%len%
)
exit /b
复制代码

作者: qixiaobin0715 时间: 2022-8-23 14:25

回复 31# aloha20200628
谢谢提供链接，内容确实精彩！！！

作者: ANSL 时间: 2022-9-6 19:53

回复 31# aloha20200628
谢谢，正想找这种代码呢!

作者: dos-a 时间: 2023-4-3 13:29

回复 31# aloha20200628
大佬，最近我又看到了Batcher大佬的多行回退，但是并未在win10中实现，不知为什么，

作者: gudou 时间: 2024-4-29 16:43

多年后的膜拜……

欢迎光临批处理之家 (http://www.bathome.net/)