[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[文本处理] 批处理如何对比两个文本?

测试1是原文,
测试1跟测试2里面的内容对比
对比后的结果导出保存到测试结果

测试2个内容排列顺序依据测试1为准
测试1和测试2对比后按照顺序保存到“测试结果”里面

比如测试2里面的第一行的内容 在测试1里面是第三行
经过批处理处理后 导出的结果是前2行是空行 第3行是内容

相关文本我已经上传到附件中 麻烦高手帮忙写个批处理 谢谢


我是win7   64位操作系统

本帖最后由 cjiabing 于 2015-1-14 00:05 编辑
  1. @echo off&setlocal EnableDelayedExpansion
  2. set line=18
  3. ::设置总行数
  4. echo;开始搜索 . . .
  5. cd.>搜索结果.txt
  6. >>搜索结果.txt findstr/ng:测试2.txt 测试1.txt
  7. >>搜索结果.txt echo %line%:
  8. echo;开始整理 . . .
  9. cd.>测试结果.txt  
  10. (
  11. for /f "tokens=1* delims=:"  %%a in (搜索结果.txt) do if not "%%a"=="" (
  12.     if not "!var!"=="" (set /a num=%%a-!var!-1) else set /a num=%%a-1
  13.     if not "!num!"=="" for /l %%i in (1,1,!num!) do echo;
  14.     echo;%%b
  15.     set var=%%a
  16. ) else (
  17.     set /a num=%line%-!var!-1
  18.     for /l %%i in (1,1,!num!) do echo;
  19. )
  20. )>>测试结果.txt  
  21. echo;
  22. echo;任务结束。
  23. echo;
  24. pause
  25. del 搜索结果.txt
复制代码

没试过几十万行的,估计要很久很久很久……
先搜索结果,再整理格式位置,效率可能高点——猜测而已,你可以做做试试!~
整理部分主要考虑了开头和结尾空格问题,如果不用考虑可以稍微简化条件判断if部分
寂寞是黑白的,但黑白不是寂寞,是永恒。BAT 需要的不是可能,而是智慧。

TOP

本帖最后由 shelluserwlb 于 2015-1-8 20:34 编辑

你这个数据很多的话完全可以放在excel中用VBA实现的
将“测试1”放到 sheet1 中分成两列(A列和B列),将"测试2"放到 sheet2 (A列)中,再运行下面的代码,结果就会出现在"sheet3"中了。
  1. Sub a()
  2.     Dim n1, n2 As Integer
  3.     Dim index1, index2 As String
  4.     Dim vlue1, vlue2 As String
  5.     n1 = WorksheetFunction.CountA(Worksheets("sheet1").Columns(1))
  6.     n2 = WorksheetFunction.CountA(Worksheets("sheet2").Columns(1))
  7.     index1 = 1
  8.     Do While index1 <= n1
  9.         vlue1 = Worksheets("sheet1").Cells(index1, 1)
  10.         index2 = 1
  11.         Do While index2 <= n2
  12.             vlue2 = Worksheets("sheet2").Cells(index2, 1)
  13.             If vlue1 = vlue2 Then
  14.                 Worksheets("Sheet1").Cells(index1, 1).Copy _
  15.                           Destination:=Worksheets("Sheet3").Cells(index1, 1)
  16.                 Worksheets("Sheet1").Cells(index1, 2).Copy _
  17.                           Destination:=Worksheets("Sheet3").Cells(index1, 2)
  18.                 Exit Do
  19.             End If
  20.             index2 = index2 + 1
  21.         Loop
  22.         index1 = index1 + 1
  23.     Loop
  24.     MsgBox "操作成功!"
  25. End Sub
复制代码

TOP

多是高手啊!我多不知道咋回事?

TOP

两个都不能使用吗
大文件个话 下面这段能否处理呢增加个临时文件 看能否提高点效率再给个 三方的
terse 发表于 2015-1-5 12:19



    谢谢你

TOP

@if(0)==(0) echo off
cscript -nologo -e:javascript %0<测试1.txt >测试结果.txt "测试2.txt"
pause&goto :eof
@end
Array.prototype.arr_ay = function(obj) {
   var i = this.length;
   while (i--) {
      if (this[i] === obj) {
        return true;
      }
   }
   return false;
}  
var arr=new ActiveXObject('Scripting.FileSystemObject').OpenTextFile(WScript.Arguments.Item(0)).readall().split('\r\n');
var re = /(\w+).*/ig;
while (!WScript.StdIn.AtEndOfStream){
    var str = WScript.StdIn.Readline();
    arr.arr_ay(str.replace(re,'$1')) ? WSH.echo(str) : WSH.echo('')
}


测试就这个好用  谢谢各位  感谢大家的帮忙

TOP

如果只是用来检查文本有哪些不同,而不一定要输出 txt 的话,也可以使用 BeyondCompare,比较直观,用很久了,用来对比 code 妥妥的,妈妈再也不用担心我不知道改了什么地方了

TOP

本帖最后由 terse 于 2015-1-5 14:14 编辑
测试不能使用  谢谢
pengyou86 发表于 2015-1-5 09:08

两个都不能使用吗
大文件个话 下面这段能否处理呢
  1. @if(0)==(0) echo off
  2. cscript -nologo -e:javascript %0<测试1.txt >测试结果.txt "测试2.txt"
  3. pause&goto :eof
  4. @end
  5. Array.prototype.arr_ay = function(obj) {
  6.    var i = this.length;
  7.    while (i--) {
  8.       if (this[i] === obj) {
  9.         return true;
  10.       }
  11.    }
  12.    return false;
  13. }  
  14. var arr=new ActiveXObject('Scripting.FileSystemObject').OpenTextFile(WScript.Arguments.Item(0)).readall().split('\r\n');
  15. var re = /(\w+).*/ig;
  16. while (!WScript.StdIn.AtEndOfStream){
  17.     var str = WScript.StdIn.Readline();
  18.     arr.arr_ay(str.replace(re,'$1')) ? WSH.echo(str) : WSH.echo('')
  19. }
复制代码
增加个临时文件 看能否提高点效率
  1. @echo off&setlocal enabledelayedexpansion
  2. findstr /ibng:测试2.txt 测试1.txt>$
  3. set n=2
  4. (for /f "tokens=1*delims=:" %%a in ($) do (
  5.     for /l %%i in (!n!,1,%%a) do echo,
  6.     echo %%b
  7.     set /a n=%%a+2
  8. ))> 测试结果.txt
  9. del $
  10. pause
复制代码
再给个 三方的
  1. @gawk "ARGIND==1{a[$0]=1}ARGIND>1{if (a[$1]){print $0}else{print a[$1]}}" 测试2.txt 测试1.txt >测试结果.txt
复制代码

TOP

回复 12# pengyou86


    所以嘛,你应该先找两个小文件验证一下功能是否正常。如果是效率不够高,人家可以优化。你留下一句“不能使用”人家怎么知道你遇到了啥问题。

TOP

回复 11# DAIC


    都快一个小时了  批处理还没有对比完毕

TOP

回复 9# pengyou86


    你需要举例说明什么叫做“不能使用”,否则人家没有办法继续帮助你。

TOP

tmplinshi 发表于 2015-1-5 02:17



    测试1文本内容很大有20多万行内容  批处理运行起来速度太慢。还有别的方法可以快速对比吗?

TOP

terse 发表于 2015-1-5 02:20


测试不能使用  谢谢

TOP

terse 发表于 2015-1-5 02:20



谢谢你,麻烦你再修改一下 把对比后的结果保存到“测试结果.txt”中
本人小菜  请谅解

TOP

tmplinshi 发表于 2015-1-5 02:17

谢谢测试成功就是运行起来速度有点慢

TOP

返回列表