我知道可以匹配一个单词,然后使用其他工具(例如grep -v)反向匹配。但是,是否可以使用正则表达式匹配不包含特定单词的行,例如hede?
输入:
hoho
hihi
haha
hede代码:
grep "<Regex for 'doesn't contain hede'>" input所需输出:
hoho
hihi
haha发布于 2009-01-02 17:55:05
regex不支持反向匹配的观点并不完全正确。您可以通过使用负环视来模仿此行为:
^((?!hede).)*$上面的正则表达式将匹配包含(子)字符串'hede‘的任何字符串或不带换行符的行,而不是。如前所述,regex在这方面并不“擅长”(或应该这样做),但它仍然是可能的。
如果您还需要匹配换行符,请使用DOT-ALL modifier (以下模式中的尾随s ):
/^((?!hede).)*$/s或者内联使用它:
/(?s)^((?!hede).)*$/(其中/.../是正则表达式分隔符,即不是模式的一部分)
如果点-ALL修饰符不可用,则可以使用字符类[\s\S]模拟相同的行为
/^((?!hede)[\s\S])*$/解释
字符串只是一个n字符的列表。在每个字符之前和之后,都有一个空字符串。因此,n字符列表将包含n+1空字符串。考虑字符串"ABhedeCD"
┌──┬───┬──┬───┬──┬───┬──┬───┬──┬───┬──┬───┬──┬───┬──┬───┬──┐
S = │e1│ A │e2│ B │e3│ h │e4│ e │e5│ d │e6│ e │e7│ C │e8│ D │e9│
└──┴───┴──┴───┴──┴───┴──┴───┴──┴───┴──┴───┴──┴───┴──┴───┴──┘
index 0 1 2 3 4 5 6 7其中e是空字符串。正则表达式(?!hede).会提前查看是否没有要看到的子字符串"hede",如果是这样的话(所以看到的是其他的东西),那么. (点)将匹配除换行符以外的任何字符。环视也被称为零宽度断言,因为它们不消耗任何字符。它们只断言/验证一些东西。
因此,在我的示例中,在. (点)使用字符之前,首先验证每个空字符串,以查看前面是否没有"hede"。正则表达式(?!hede).只会这样做一次,所以它被包装在一个组中,并重复0次或多次:((?!hede).)*。最后,锚定输入的开始和结束,以确保整个输入都被使用:^((?!hede).)*$
正如您所看到的,输入"ABhedeCD"将失败,因为在e3上,正则表达式(?!hede)失败(前面有"hede"!)。
发布于 2011-03-17 12:21:27
请注意,的解决方案不会从“hede”开始
^(?!hede).*$通常比does not contain “hede”的解决方案更有效
^((?!hede).)*$前者只在输入字符串的第一个位置检查“hede”,而不是在每个位置。
发布于 2009-01-02 07:41:23
如果您只是在grep中使用它,那么可以使用grep -v hede来获取所有不包含hede的行。
哦,重读这个问题,grep -v可能就是你所说的“工具选项”。
https://stackoverflow.com/questions/406230
复制相似问题