给定一个包含大约1,200个文本文件的文件夹,这些文本文件都是以这种方式格式化的.
Time range of SELECTION
From 1.133071 to 4.457098 seconds (duration: 3.324027 seconds)
Pitch:
Median pitch: 172.651 Hz
Mean pitch: 167.584 Hz
Standard deviation: 48.839 Hz
Minimum pitch: 59.460 Hz
Maximum pitch: 269.304 Hz
Pulses:
Number of pulses: 216
Number of periods: 141
Mean period: 6.646523E-3 seconds
Standard deviation of period: 2.969047E-3 seconds
Voicing:
Fraction of locally unvoiced frames: 46.348% (368 / 794)
Number of voice breaks: 13
Degree of voice breaks: 50.270% (1.670989 seconds / 3.324027 seconds)
Jitter:
Jitter (local): 5.795%
Jitter (local, absolute): 385.185E-6 seconds
Jitter (rap): 2.361%
Jitter (ppq5): 1.908%
Jitter (ddp): 7.083%
Shimmer:
Shimmer (local): 20.262%
Shimmer (local, dB): 1.841 dB
Shimmer (apq3): 10.382%
Shimmer (apq5): 22.335%
Shimmer (apq11): --undefined--
Shimmer (dda): 31.145%
Harmonicity of the voiced parts only:
Mean autocorrelation: 0.515841
Mean noise-to-harmonics ratio: 1.232685
Mean harmonics-to-noise ratio: 0.331 dB
...how是否可以编写一种程序,遍历这些文件中的1,200个文件,只在字符串“持续时间”、“平均音调:”、“最小音高:”、“最大音调:”、“抖动(本地):”、“抖动(rap):”、“”、“均值-谐波比:”和“平均谐波-对--噪声比:”之后提取数值,并将它们写入一个大文件(我可以打开或粘贴到Excel中),其中每个文本文件包含一行值?
我在这些论坛中发现了类似的问题,这些问题已经用Python解决了,但我很难理清所有代码是如何工作的。我不太擅长那类事情。有人能帮忙吗?
发布于 2013-12-03 18:02:55
这个问题有点离题;一般来说,一旦你尝试了一些问题,你就应该到这里来。然而:
os.walk
。open
和文件对象的内容。https://stackoverflow.com/questions/20358248
复制相似问题