文章/答案/技术大牛

发布

社区首页 >问答首页 >电影字幕的python正则表达式

问电影字幕的python正则表达式
EN

Stack Overflow用户

提问于 2013-12-06 09:44:15

回答 2查看 133关注 0票数 0

我试图做一个简单的regex来识别微dvd格式：

{52}{118}some text
{123}{202}some text
{203}{259}some text
{261}{309}some text

我的代码如下所示。match_obj是零，我不知道为什么：

import re
my_re = r"\{([0-9]*)\}\{[0-9]\}(.*)"
f = open('abc.txt')
match_obj = re.match(my_re, f.readline())

我也尝试过：

match_obj = re.match(my_re, f.readline(), re.M|re.I)

结果是一样的。

python

regex

回答 2

Stack Overflow用户

回答已采纳

发布于 2013-12-06 09:46:57

你离得很近，只是在第二个数字部分少了一个重复的符号。您的正则表达式应该如下所示：

my_re = r"\{([0-9]*)\}\{[0-9]*\}(.*)"

注意在第二个[]块之后添加的星号。

票数 3

Stack Overflow用户

发布于 2013-12-06 09:50:37

\{([0-9]*)\}\{[0-9] \}(.*)
                  /|\
                   |

你在第二个数字字符类中缺少了一个中继器。

我不确定电影字幕的规则，但我认为括号不可能是空的。

然后将进行更严格的调整(尽管在您的情况下可能不需要)：

\{([0-9]+)\}\{[0-9]+\}(.*)

+中继器意味着1或更多。*中继器意味着0或更多。

你只对第一个号码感兴趣吗？
文本是可选的吗？

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/20420678

复制

相似问题

问电影字幕的python正则表达式
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问电影字幕的python正则表达式EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问电影字幕的python正则表达式
EN