我正在尝试查找所有以h开头的单词,但我需要排除html标记,就像在这个搜索中一样。我有查找所有以h开头的单词的代码:
\h\w+
我只是不知道如何在我的搜索中排除东西,特别是一个html标签。
发布于 2016-12-09 18:21:39
使用de exclude character [^]
[^<]h\w+
但我认为这种方式可能更适合您的需要,因为它会为每个以h开头的不是a的单词生成一个匹配
(?!<)h\w+
更好的方法是,执行以下匹配:
((?!<)h\w+)
(请密切关注,第一个(
前面有一个空格)
如果文本为:
html teste agharro hzete h
它将与“homem”和“hzete”进行完全匹配,这是第一个匹配您想要的单词。"homem","hzete“。
我向你推荐一个图形化的正则表达式验证工具,这样你就可以实时看到你正在编写的表达式。一个很好的例子是https://regex101.com/
希望这能有所帮助。
https://stackoverflow.com/questions/41066251
复制相似问题