文章/答案/技术大牛

发布

问用RegExp选择范围
EN

Stack Overflow用户

提问于 2013-03-17 01:01:03

回答 2查看 204关注 0票数 1

我将用示例代码解释我想要的是什么。我的函数GetDox看起来很接近，但仍然不完整。这是一个测试代码。

'test begin...
'<dox>
'  <member type="Public Sub" name="Increment" return="void">
'    <param type="Integer" name="nBase" out="true" />
'    <param type="Integer" name="nStep" out="false" />
'    <purpose>
'      purpose here...
'    </purpose>
'  </member>
'  <member ... />
'</dox>
'other comments here...
Public Sub Increment(nBase, nStep) 'some example content
    nBase = nBase + nStep
End Sub
'<Unwonted_Item />

Dim source  'reading the same file just for simplification
With CreateObject("Scripting.FileSystemObject")
    With .OpenTextFile(WScript.ScriptFullName, 1, False)
        source = .ReadAll
    End With
End With
result = GetDox(source)
WScript.Echo result  'display our result

Function GetDox(sCode)  'unfinished function
    Dim regEx, Match, Matches, mVal, sEnd
    sEnd = "</dox>" & vbNewLine
    Set regEx = New RegExp
    regEx.Pattern = "('<dox>\n|'\s*<.*)" 'my ugly pattern
    regEx.IgnoreCase = True
    regEx.Global = True
    Set Matches = regEx.Execute(sCode)
    For Each Match In Matches
        mVal = Match.Value
        mVal = Replace(mVal, vbCr, vbNewLine)
        mVal = Right(mVal, Len(mVal) - 1)
        GetDox = GetDox & mVal
        If mVal = sEnd Then Exit For
    Next
End Function

我得到的是：

<dox>
  <member type="Public Sub" name="Increment" return="void">
    <param type="Integer" name="nBase" out="true" />
    <param type="Integer" name="nStep" out="false" />
    <purpose>
    </purpose>
  </member>
  <member ... />
</dox>

这就是我需要的：

<dox>
  <member type="Public Sub" name="Increment" return="void">
    <param type="Integer" name="nBase" out="true" />
    <param type="Integer" name="nStep" out="false" />
    <purpose>
      purpose here...
    </purpose>
  </member>
  <member ... />
</dox>

这句话的意思是“目的在这里”我知道整个RegExp.Pattern语法都很弱。我只想选择以<dox>开头，以</dox>结尾的全部内容，包括所有内容，但我仍然停留在模式语法上。

P.S.提供了如此出色的帮助(感谢所有的人)，这是我现在的工作职责：

Function GetDox(sCode)
    GetDox = vbNullString
    With New RegExp
        .Pattern    = "<dox>[\s\S]*?</dox>"
        .IgnoreCase = True
        .Global     = False
        With .Execute(sCode)
            If .Count = 0 Then Exit Function
            GetDox  = .Item(0).Value
        End With
        .Pattern    = "^'"
        .Global     = True
        .Multiline  = True
        GetDox = .Replace(GetDox, "")
    End With
End Function

regex

syntax

vbscript

回答 2

Stack Overflow用户

回答已采纳

发布于 2013-03-17 10:53:52

我首先删除前面的单引号：

regEx.Pattern = "^'"
regEx.Global  = True
sCode = regEx.Replace(sCode, "")

然后提取XML文本：

regEx.Pattern = "<dox>[\s\S]*?</dox>"
regEx.Global  = False
regEx.IgnoreCase = True
Set m = regEx.Execute(sCode)
If m.Count > 0 Then GetDox = m(0).Value

在此之后，您应该将XML读入DOM树以进行进一步处理：

Set xml = CreateObject("Msxml2.DOMDocument.6.0")
xml.async = False
xml.loadXML result

如果您的XML位于一个单独的文件中，那么您应该直接从文件中加载XML，并使用XPath表达式提取节点，就像@FrankSchmitt在他的评论中所建议的那样。

Set xml = CreateObject("Msxml2.DOMDocument.6.0")
xml.async = False
xml.load "C:\path\to\your.xml"

Set nodes = xml.selectNodes("//dox")

XML不是面向行的，不应该被解析为它是面向行的。如果你处理不好，事情可能会以有趣的方式破裂。

票数 2

Stack Overflow用户

发布于 2013-03-17 04:31:37

要修复代码，可以使用下面的regex：('<dox>\n|'\s*[\S \t]*) 演示

另一种方法是首先使用<dox>[\s\S]+?<\/dox>获取所需的一切，然后在其上应用一个替换：

搜索：^'和nothing替换

或者，清除前面的空格：

搜索：^'\s*和nothing替换，演示

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/15456505

复制

相似问题

问用RegExp选择范围
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用RegExp选择范围EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用RegExp选择范围
EN