我实际上是在做一个程序,我想手动复制和粘贴网页的源代码,程序应该找到源代码的某一部分,并将其从字符串的其余部分中剪切出来。
我找不到如何把它从剩下的文本中去掉的方法。
所以我有一个类似如下的字符串:
"<b>abcdefgh qwertzuiop thepartineedtocut</b>abcdefght mnbvcxy"我只需要:
"thepartineedtocut"问题是,它不会总是同一个词,但它周围的词不会改变。我希望你能理解我。谢谢。祝您今天愉快。
发布于 2014-04-09 22:10:20
我会使用HtmlAgilityPack来解析html,但也许这种简单的方法就足够了:
如果规则是:“<b>中最后一个单词的字符串是什么... </b>":
Dim myString = "<b>abcdefgh qwertzuiop thepartineedtocut</b>abcdefght mnbvcxy"
Dim result As String = Nothing
Dim bTokenStart = myString.IndexOf("<b>", StringComparison.OrdinalIgnoreCase)
If bTokenStart >= 0 Then
    bTokenStart += "<b>".Length
    Dim bTokenEnd = myString.IndexOf("</b>", bTokenStart, StringComparison.OrdinalIgnoreCase)
    If bTokenEnd >= 0 Then
        Dim bToken = myString.Substring(bTokenStart, bTokenEnd - bTokenStart)
        result = bToken.Split({" "}, StringSplitOptions.RemoveEmptyEntries).Last()  ' thepartineedtocut
    End If
End If发布于 2014-04-09 22:45:46
您可以使用正则表达式:
Dim input As String = "<b>abcdefgh qwertzuiop thepartineedtocut</b>abcdefght mnbvcxy"
Dim re As New System.Text.RegularExpressions.Regex("(\w+)</b>")
Console.WriteLine(re.Match(input).Groups(1).Value) 'outputs: thepartineedtocut这里的规则是:在结束</b>标记之前找到一个单词。
发布于 2014-04-09 22:08:06
我建议您结合使用IndexOf和Mid。
https://stackoverflow.com/questions/22965035
复制相似问题