我正在建立一个电影字幕下载脚本。我计划从下载字幕。在我的个人电脑里,我有一个名为namelist的列表中所有电影的标题。所以我计划在上面的搜索框中一个一个地发送电影名字,搜索它们并从第一个结果下载字幕。我使用以下代码
homeurl="http://www.isubtitles.net"
for i in range (0, len(namelist)):
browser.get(homeurl)
searchele=browser.find_element_by_name("kwd")
searchele.send_keys(namel
我是编程和Python的初学者,我正在编写一个脚本来处理.srt字幕文件。我的问题是,我不知道如何:读取一个文件,首先分析文本在文本开头和第一行之间,然后在空行和下一行之间,直到文件的末尾(例如,通过计算其中一部分的长度,将另一个部分转换为数字等)。
您可以阅读有关.srt格式规范的内容,并可以看到一个示例 (类型:平原);文件末尾有一个空行。我希望将每个字幕的显示时间/持续时间与其中的字符数进行比较。从文件的开头开始,每个字幕(包含其编号、持续时间信息和文本)与下一个字幕用空行分隔( "\n",我可以用if "\n" in line and len(line)
我有一些字幕的问题,我需要一种方法来检测特定的错误。我认为正则表达式会有所帮助,但需要帮助来弄清楚这一点。在SRT格式的字幕的这个例子中,行#13结束于00:01:10,130,行#14开始于00:01:10:129。
13
00:01:05,549 --> 00:01:10,130
some text here.
14
00:01:10,129 --> 00:01:14,109
some other text here.
问题是,下一行不能在当前行之前开始-当这种情况发生时,过度嵌入算法不起作用。我需要检查我的SRT文件并手动更正,但手动在大约20个视频中查找,每个视频一小时长