Board logo

标题: [技术讨论] VBS 正则匹配失败竟会导致脚本暂停 [打印本页]

作者: tmplinshi    时间: 2015-4-13 17:14     标题: VBS 正则匹配失败竟会导致脚本暂停

  1. data = ReadTextFile("match_stop.txt")
  2. set ms = RegExMatch(data, "class=""smallphoto"" id=""(.*?)"".*?src=""(.*?)""[\s\S]*?author=""(.*?)""[\s\S]*?photoCName"">[\s\S]*?"">(.*?)<[\s\S]*?photoLName"">[\s\S]*?href=""(.*?)""[\s\S]*?class=""LatinName"">(.*?)<")
  3. MsgBox ms.count
  4. ' 去掉末尾的【""LatinName"">(.*?)<】则正常
  5. ' set ms = RegExMatch(data, "class=""smallphoto"" id=""(.*?)"".*?src=""(.*?)""[\s\S]*?author=""(.*?)""[\s\S]*?photoCName"">[\s\S]*?"">(.*?)<[\s\S]*?photoLName"">[\s\S]*?href=""(.*?)""[\s\S]*?class=")
  6. Function RegExMatch(ByRef inputstr, Pattern)
  7. Set re = New RegExp
  8. re.Pattern = Pattern
  9. re.IgnoreCase = True
  10. re.Global = True
  11. MsgBox "呵呵呵,脚本要停止运行了..下面的 MsgBox 你看不见了."
  12. Set RegExMatch = re.Execute( inputstr )
  13. MsgBox "你看不见我,你看不见我"
  14. End Function
  15. Function ReadTextFile(fPath)
  16. Set filesys = CreateObject("Scripting.FileSystemObject")
  17. Set filetxt = filesys.OpenTextFile(fPath, 1)
  18. ReadTextFile = filetxt.ReadAll
  19. End Function
复制代码

作者: CrLf    时间: 2015-4-13 17:59

测试下面这段好像正常的哟
  1. data = "fasdfasdf"&vbCrLf&"_ffsafdwsaf"
  2. set ms = RegExMatch(data, "asdfasdf@<")
  3. MsgBox ms.count
  4. Function RegExMatch(ByRef inputstr, Pattern)
  5. Set re = New RegExp
  6. re.Pattern = Pattern
  7. re.IgnoreCase = True
  8. re.Global = True
  9. MsgBox "呵呵呵,脚本要停止运行了..下面的 MsgBox 你看不见了."
  10. Set RegExMatch = re.Execute( inputstr )
  11. MsgBox "你看不见我,你看不见我"
  12. End Function
复制代码

作者: tmplinshi    时间: 2015-4-13 19:28

是的,并不是所有情况都会导致脚本暂停。可是我顶楼给出的例子就是会导致脚本暂停。
作者: yu2n    时间: 2015-4-15 18:10

这不是 VBS 的问题。
目测表达式太长、或其他未知的表达式错误。
作者: tmplinshi    时间: 2015-4-16 01:36

本帖最后由 tmplinshi 于 2015-4-16 01:41 编辑

回复 4# yu2n
并不是目标表达式太长,如果我把表达式换成下面这行则运行正常、匹配成功(以下表达式比原来的还长):
set ms = RegExMatch(data, "class=""smallphoto"" id=""(.*?)"".*?src=""(.*?)""[\s\S]*?author=""(.*?)""[\s\S]*?photoCName"">[\s\S]*?"">(.*?)<[\s\S]*?photoLName"">[\s\S]*?href=""(.*?)""[\s\S]*?class=""plantname"".*?>(.*?)<")


脚本暂停,仅仅是表达式的末尾部分“LatinName"">(.*?)<”在源文件中找不到。既然找不到,正常情况 VBS 应该处理为匹配失败,而不是把脚本暂停了。

代码语法也并没有错误。既然代码语法没有错误,那么正则匹配无非两种结果——成功或者失败,“表达式错误”那就应该处理为匹配失败。

所以这当然是 VBS 的问题。
作者: tmplinshi    时间: 2015-4-16 01:57

本帖最后由 tmplinshi 于 2015-4-16 02:50 编辑

知道原因了,是因为达到了匹配的最大(长度?)限制,导致 VBS 卡住了。我用那个表达式在 AutoHotkey 中进行匹配也返回了 -8 的 ErrorLevel 值("reached match limit" (-8))。

试了下添加“On error resume Next”并没有效果,有方法忽略这个错误吗?

=====================================

匹配过程估计是这样:
由于数据中有比较多的 [\s\S]*?class="",但是数据中并没有 [\s\S]*?class=""LatinName,所以电脑不停地往前搜索 [\s\S]*?class="",结果到达了匹配的最大长度限制。




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2