我有一个这样的字符串:
Name is A, Last:B
Last Login: 10 min
我只想提取姓名和上次登录时间
当我使用如下所示的regex时
Name is ([A-Z])[\s\w,:]+
它变得贪婪,匹配了整个字符串,所以我无法提取上次登录时间(10分钟)。我如何阻止贪婪超出一行?
对此有什么帮助吗?
发布于 2018-07-07 02:33:53
给定:
>>> print s
Name is A, Last:B
Last Login: 10 min
您可以使用带有re.M
多行标志的re.search
来捕获该模式:
>>> re.search(r"^(Name is[^,]*).*\s*(^Last Login:.*)",s,re.M).groups()
('Name is A', 'Last Login: 10 min')
或者,如果您只想要固定字段之后的数据:
>>> re.search(r"^Name is\s*([^,]*).*\s*^Last Login:\s*(.*)",s,re.M).groups()
('A', '10 min')
或者,您可以使用look behinds来查看您想要的字段,然后捕获以下内容:
>>> re.search(r"(?<=Name is)\s*([^,]*),.*\n.*(?<=Last Login:)\s*(.*)",s).groups()
('A', '10 min')
发布于 2018-07-07 02:17:13
我不能完全确定您试图用[\s\w,:]+
避免什么,但是您可以直接使用"Name is ([A-Z]\w*), Last:([A-Z]\w*)\nLast Login: (\d+)"
>>> re.match(r"Name is ([A-Z]\w*), Last:([A-Z]\w*)\nLast Login: (\d+)",
... 'Name is A, Last:B\nLast Login: 10 min').groups()
('A', 'B', '10')
只要re.dotall
未激活,您就可以使用.+
,它不会匹配换行符。
https://stackoverflow.com/questions/51214790
复制相似问题