我有一个关键字列表,并希望提取文档中可以找到的所有关键字。一个关键字可以是另一个关键字的子字符串。我尝试使用re.findall函数进行提取,但我得到的不是一个关键字,就是关键字的子字符串。如果'A‘和'A B’是关键字,我想两者都提取。文档是"A B C D"。关键字是"A", "B", "A B"。regex</em
所以我有一个字符串,它包含一个子字符串的多次出现。所有这些字符串的格式如下:<c@=someText>Content<c>This combination of plain text and <c=@flavor> colored text<<c>
我想通过regex提取每个子子。但是,如果我使用下面的regex <c=@.+?(?=>)>.*<c