当我设置Sphinx 4转录音频文件时,如何在Sphinx 4中获得时间索引(或帧编号)?
我使用的代码如下所示:
audioURL = ...
AudioFileDataSource dataSource = (AudioFileDataSource) cm.lookup("audioFileDataSource");
dataSource.setAudioFile(audioURL, null);
Result result;
while ((result = Recognizer.recognize()) != null) {
Token token = result.getBestToken();
//DoubleData data = (DoubleData) token.getData();
//long frameNum = data.getFirstSampleNumber(); // data seem always null
String resultText = token.getWordPath(false, false);
...
}
我试图从result/token对象中获取转录时间,例如,类似于字幕者所做的事情。我找到了Result.getFrameNumber()和Token.getFrameNumber(),但它们似乎返回解码的帧数,而不是在整个音频文件的上下文中找到结果的时间(或帧)。
我查看了AudioFileDataSource.getDuration()=private和Recognizer类,但还没有弄清楚如何获得所需的转录时间索引。
想法?:)
发布于 2013-09-27 15:35:14
帧数是时间乘以帧速率,即100帧/秒。
无论如何,请在这里找到字幕演示的补丁,它会返回时间:
http://sourceforge.net/mailarchive/forum.php?thread_name=1380033926.26218.12.camel%40localhost.localdomain&forum_name=cmusphinx-devel
该补丁适用于subversion主干,而不适用于1.0-beta版本。
请注意,这部分正在进行重大重构,因此API很快就会过时。然而,我希望你能够创建字幕,只需要很少的调用,而不需要所有当前的复杂性。
https://stackoverflow.com/questions/19041354
复制相似问题