我有一个庞大的数据集,其中包含大量需要抓取的文件名和字符串的不同部分。
我现在有这个代码段:
def fps(data):
for i in data:
pattern = r'.(\d{4}).' # finds data in between the periods
frames = re.findall(pattern, ' '.join(data)) #puts info into frames list
frames.sort()
for i in range(len(frames)): #Turns the str into integers
frames[i] = int(frames[i])
return frames
这很好,但是它只返回句点前后的4个字符。如何在一个句点之后和下一个句点之前抓取字符串的一部分。最好不要使用常规编辑,因为它对我这样的笨蛋来说有点太复杂了。
例如:一个字符串可能如下所示
string = ['filename.0530.extension']
而其他的可能看起来像这样
string2 = ['filename.042.extension']
string3 = [filename.045363.extension']
我需要在终端上输出句点之间的数字,因此: 0530,042,045363
https://stackoverflow.com/questions/51142869
复制相似问题