我有一个字符串:
"abc mysql 23 rufos kanso engineer"
我希望正则表达式输出单词"engineer“之前的字符串,直到它看到一个数字。
也就是说,regex应该输出:
23 rufos kanso
另一个例子:
字符串:
def grusol defno 1635 minos kalopo, ruso engineer okas puno"
我希望正则表达式输出单词"engineer“之前的字符串,直到它看到一个数字。
也就是说,regex应该输出:
1635 minos kalopo, ruso
我可以通过一系列正则表达式来实现这一点。
我能一次完成这件事吗?
谢谢
发布于 2019-07-11 15:16:03
我使用的模式是:((\d+)(?!.*\d).*)engineer
--它查找最新的数字,然后从那里开始。
类似于(\d.*)engineer
的东西也可以工作,但前提是字符串中只有一个数字。
>>> import re
>>> string = '123 abc mysql 23 rufos kanso engineer'
>>> pattern = r'((\d+)(?!.*\d).*)engineer'
>>> re.search(pattern, string).group(1)
'23 rufos kanso '
>>>
编辑
如果'engineer‘部分后面有数字,则上面提到的模式不起作用,正如您在注释中指出的那样。我试图解决这个问题,但老实说,我想不出一个新的模式(对不起)。
我可以建议的解决方法是,假设'engineer‘仍然是'key’这个词,用这个词拆分你的初始字符串。
下面是我的意思的说明:
>>> string = '123 abc mysql 23 rufos kanso engineer 1234 b65 de'
>>> string.split('engineer')
['123 abc mysql 23 rufos kanso ', ' 1234 b65 de']
>>> string.split('engineer')[0]
'123 abc mysql 23 rufos kanso '
# hence, there would be no unexpected digits
>>> s = string.split('engineer')[0]
>>> pattern = r'((\d+)(?!.*\d).*)'
>>> re.search(pattern, s).group(1)
'23 rufos kanso '
发布于 2019-07-11 15:18:27
使用positive look-ahead
进行匹配,直到单词engineer前面有一个数字。
The regex
- (?=\d)(.+)(?=engineer)
只是为了得到一个想法:
import re
pattern = r"(?=\d)(.+)(?=engineer)"
input = [ "\"def grusol defno 1635 minos kalopo, ruso engineer okas puno\"", "\"abc mysql 23 rufos kanso engineer\"" ]
matches = []
for item in input:
matches.append(re.findall(pattern, item))
输出:
[['1635 minos kalopo, ruso '], ['23 rufos kanso ']]
https://stackoverflow.com/questions/56983420
复制相似问题