文章/答案/技术大牛

发布

社区首页 >问答首页 >Regex从短语到带条件的doc结尾

问Regex从短语到带条件的doc结尾
EN

Stack Overflow用户

提问于 2019-05-03 09:49:01

回答 1查看 37关注 0票数 0

我有一个开始短语，比如fruits。我有一些结尾短语，如apple，banana和pineapple。

我有一些变量为text的文档

水果它们对健康有益..。应该吃苹果
水果定期吃香蕉你需要的水果吃苹果
水果是好的每天我们应该吃菠萝一般来说，水果含有多种矿物质。大多数都很好吃。

我的Regex和代码：

p = r'(\bFruits\b\s*\w*\s*\n*.*?(\bApples?\b|\bbananas?\b|\bpineapples?\b))'
sep = ";;"
lst = re.findall(p, text, re.I|re.M|re.DOTALL)
val = sep.join(str(v) for v in lst )

上述正则表达式在text 1&2中运行良好，在text 3中部分工作。

问题

我所需要的是，当我们遇到成果，却找不到任何结尾短语，然后，然后，直到文件的结尾。

预期来自 text 3的输出

Fruits are good Daily we should have pineapple ;; fruits have various minerals.
Most of them are very tasty

P.S.：我也试过$，但也没用。

python

regex

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-05-03 10:07:51

在表达式中包括\Z，如下所示

text = '''Fruits are good

Daily we should have pineapple

In general, Fruits have various minerals.

Most of them are very tasty
'''

p = r'(\bFruits\b\s*\w*\s*\n*.*?(\bApples?\b|\bbananas?\b|\bpineapples?\b|\Z))'
sep = ";;"
lst = re.findall(p, text, re.I|re.M|re.DOTALL)
val = sep.join(str(v) for v in lst )
print(val)

输出如下

('Fruits are good\n\nDaily we should have pineapple', 'pineapple');;('Fruits have various minerals.\n\nMost of them are very tasty\n', '') [Finished in 0.1s]

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/55967277

复制

相似问题

问Regex从短语到带条件的doc结尾
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Regex从短语到带条件的doc结尾EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Regex从短语到带条件的doc结尾
EN