我有一行文本,我需要从中提取一个子字符串,该子字符串后面可能有字符,也可能没有字符。示例:
Robin Hood viewed item "something.mov" (99.12345.567891011)或者..。
Robin Hood viewed item "something.mov" (88.123.456789101) some other stuff.我需要提取括号内的子字符串。子字符串将始终是由两个句点分隔的三组数字。带引号并在末尾带有.mov的字符串也可以包含任意字符,因此搜索应始终从行尾开始。
如果在结束的paren后面有字符,那么在行尾将有一个.。如果结束的paren后面没有字符,那么在行尾就不会有.。
现在我有:
mo = re.search(r'(\d[\d.]*)\).*$', data1)然而,这在某些比赛中会中断。问题是我正在使用的工具(Matillion)没有显示出它失败的行,所以我不知道为什么。
发布于 2018-09-08 03:40:52
看起来这应该行得通:
mo = re.search(r'\((\d+\.\d+\.\d+)\)'), data1);这与一个左括号、由.分隔的3组数字和一个右括号匹配。这些数字集将位于捕获组1中。
如果只想匹配一行上的最后一组括号,可以使用:
mo = re.search(r'\((\d+\.\d+\.\d+)\)[^()]*$'), data1);[^()]*$确保在此集合和行尾之间不再有括号。
https://stackoverflow.com/questions/52228631
复制相似问题