Board logo

标题: [转贴] VBScript脚本创建正则表达式对象的两种方法 [打印本页]

作者: find    时间: 2012-2-28 21:52     标题: VBScript脚本创建正则表达式对象的两种方法

貌似我看过的 VBScript 书籍没有一本介绍过这种写法,当然,书上没写的东西还有很多

一直以来,我都是用 New RegExp 来创建正则表达式对象的:
Set regex = New RegExp然而最新才发现 VBS 的正则表达式对象也可以这样创建:
Set regex = CreateObject("VBScript.RegExp")貌似我看过的 VBScript 书籍没有一本介绍过这种写法,当然,书上没写的东西还有很多。

既然提到了正则表达式,那么就顺便说一下,VBS 的正则表达式对象是支持 MultiLine 模式的,对象有一个 MultiLine 属性。运行 Visual C++ 自带的 OLE View,左边树展开 Type Libraries,找到 Microsoft VBScript Regular Expressions 5.5,可以看到该 COM 对象的属性和方法:


  1. interface IRegExp2 : IDispatch {
  2. [id(0x00002711), propget]
  3. HRESULT Pattern([out, retval] BSTR* pPattern);
  4. [id(0x00002711), propput]
  5. HRESULT Pattern([in] BSTR pPattern);
  6. [id(0x00002712), propget]
  7. HRESULT IgnoreCase([out, retval] VARIANT_BOOL* pIgnoreCase);
  8. [id(0x00002712), propput]
  9. HRESULT IgnoreCase([in] VARIANT_BOOL pIgnoreCase);
  10. [id(0x00002713), propget]
  11. HRESULT Global([out, retval] VARIANT_BOOL* pGlobal);
  12. [id(0x00002713), propput]
  13. HRESULT Global([in] VARIANT_BOOL pGlobal);
  14. [id(0x00002717), propget]
  15. HRESULT Multiline([out, retval] VARIANT_BOOL* pMultiline);
  16. [id(0x00002717), propput]
  17. HRESULT Multiline([in] VARIANT_BOOL pMultiline);
  18. [id(0x00002714)]
  19. HRESULT Execute(
  20. [in] BSTR sourceString,
  21. [out, retval] IDispatch** ppMatches);
  22. [id(0x00002715)]
  23. HRESULT Test(
  24. [in] BSTR sourceString,
  25. [out, retval] VARIANT_BOOL* pMatch);
  26. [id(0x00002716)]
  27. HRESULT Replace(
  28. [in] BSTR sourceString,
  29. [in] VARIANT replaceVar,
  30. [out, retval] BSTR* pDestString);
  31. };
复制代码


但是很多书上并没有介绍,VbsEdit 的自动完成功能中也没有提示 MultiLine 属性,甚至微软官方的参考手册上也没有。

最后举个简单的例子,假如你想把文本中的空行删除,可以用下面的代码:


  1. 'Author: Demon
  2. 'Link: http://demon.tw/programming/vbs-regexp-object.html
  3. 'Date: 2011/12/26
  4. Dim fso, regex, str
  5. Set fso = CreateObject("Scripting.FileSystemObject")
  6. Set regex = CreateObject("VBScript.RegExp")
  7. str = fso.OpenTextFile("demon.txt").ReadAll
  8. regex.Global = True
  9. regex.MultiLine = True
  10. regex.Pattern = "^\s*\n"
  11. str = regex.Replace(str, "")
  12. '相当于JavaScript中的 str = str.replace(/^\s*\n/gm, "")
  13. fso.OpenTextFile("demon.txt", 2).Write str
复制代码


http://demon.tw/programming/vbs-regexp-object.html
作者: powerbat    时间: 2012-2-28 22:19

关于Multiline
mkMSITStore:C:\windows\Help\script56.chm::/html/jsgrpRegExpSyntax.htm
^ 匹配输入字符串的开始位置。如果设置了 RegExp 对象的 Multiline 属性,^ 也匹配 '\n' 或 '\r' 之后的位置。

使用实例(最后一楼)
http://www.bathome.net/viewthread.php?tid=5625

关于CreateObject("VBScript.RegExp"),玩过asp的应该都知道吧。(据说asp的vbs脚本中不能用new?只有听说而已,本人不懂asp)
作者: powerbat    时间: 2012-2-28 22:41

script56.chm
mkMSITStore:C:\windows\Help\script56.chm::/html/reconBackreferences.htm
  1. hh.exe script56.chm::/html/reconBackreferences.htm
复制代码
使用上面所示的正则表达式,下面的 JScript 代码可以使用子匹配信息,在一个文字字符串中将连续出现两次的相同单词替换为一个相同的单词:

var ss = "Is is the cost of of gasoline going up up?.\n";
var re = /\b([a-z]+) \1\b/gim;       //创建正则表达式样式。
var rv = ss.replace(re,"$1");   //用一个单词替代两个单词。

最接近的等价 VBScript 代码如下:

Dim ss, re, rv
ss = "Is is the cost of of gasoline going up up?." & vbNewLine
Set re = New RegExp
re.Pattern = "\b([a-z]+) \1\b"
re.Global = True
re.IgnoreCase = True
re.MultiLine = True
rv = re.Replace(ss,"$1")

作者: powerbat    时间: 2012-2-28 22:44

晕,怎么又支持表情了,还强行占用字符序列快捷键。。
mk:@MSITStore:C:\windows\Help\script56.chm::/html/reconBackreferences.htm




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2