我正在使用wit.ai作为(可能)在我自己的个人助理中的语音到文本服务的临时解决方案。然后,我将这些转录的文本传递到其他地方进行进一步分析。最终,我可能会转而使用一些更强大的工具(Watson、PocketSphinx等),但wit.ai似乎是不错的第一步,因为它是免费和简单的。
但是,我想在wit.ai中添加我自己的自定义单词。具体地说,我的音乐播放器的乐队名称不是真正的英语。
理想情况下,我应该能够上传一个大文件,或者多次使用它所期望的示例短语来访问api。
类似于:
Play Black Dog by Led Zeppelin
Play Come Down by Anderson Paak
Play Hippie Babysitter by Papadosio
像Paak
和Papadosio
这样的单词不在字典里,但可以像任何单词一样发音。我知道CMUSphinx/PocketSphinx可以很好地做到这一点。有没有人知道Wit.ai可以做到这一点?
发布于 2017-02-02 20:42:35
我不认为在wit.ai中添加你自己的音频数据是可能的(这一点我不确定,但我打赌你不能,因为它是一个闭源的专业系统)。编辑:您可以在他们的在线界面的收件箱>音频部分更正您的音频转录,这可能足以满足您的需要。
您还提到了CMU Sphinx;他们接受音频贡献,以便通过VoxForge改进可用的语言。
另一个选择是Google Speech Recognition API,它有一个非常广泛的音频语料库,提供了非常好的结果。您可能想尝试它(您可以在链接中在线测试它)与您的自定义乐队名称,看看它是否适合您的需要。
https://stackoverflow.com/questions/41607023
复制相似问题