我想用Python编写一个简单的正则表达式,从HTML中提取一个数字。HTML示例如下所示:
Your number is <b>123</b>
现在,我如何提取"123",即字符串"Your number is“之后的第一个粗体文本的内容?
发布于 2012-06-24 00:18:38
import re
m = re.search("Your number is <b>(\d+)</b>",
"xxx Your number is <b>123</b> fdjsk")
if m:
print m.groups()[0]
发布于 2012-06-24 00:20:56
import re
x = 'Your number is <b>123</b>'
re.search('(?<=Your number is )<b>(\d+)</b>',x).group(0)
这将搜索'Your number is‘字符串后面的数字
发布于 2014-02-18 03:20:11
import re
print re.search(r'(\d+)', 'Your number is <b>123</b>').group(0)
https://stackoverflow.com/questions/11171045
复制相似问题