我有一行xml,希望将所有文本部分解析为文本列表。
text = '<string name="status">Finishing <xliff:g id="number">%d</xliff:g> percent.</string>'
我想要的输出:
desired_output = ['Finishing', '%d', 'percent.']
我在这个简单的任务中使用了正则表达式。
import re
pattern = re.compile(r'>.+<')
match = re.findall(pattern, text)
match = ['>Finishing <xliff:g id="number">%d</xliff:g> percent.<']
正则表达式似乎无法获得我想要的输出。
发布于 2017-04-06 03:55:47
更新您的正则表达式
pattern = re.compile(r'. *?>(.+?)<')
如果您正在使用xml/html解析,您可能会考虑使用美酒汤,这将为您节省大量时间来编写更多regex,但是如果您想学习regex,则需要反复尝试。
https://stackoverflow.com/questions/43245321
复制相似问题