我正在尝试编写一个程序,通过麦克风接收用户的音频,然后将所说的内容转换为文本以进行进一步的操作。
我知道google有这样一个东西,但它是为Android开发人员准备的,我正在尝试制作更像chrome扩展的东西(chrome扩展是我所设想的,但我对其他选择持开放态度)。
我已经看过Mac的NSSpeechRecognizer了,但我需要更全面的东西,因为这需要你提前指定一个有限的语法。
我不能期望或预测我的用户会对着麦克风说什么(但我可以假设它会是英语)。
发布于 2011-10-21 22:32:36
谷歌有一个非官方的应用程序接口,可以按照本文中的描述使用:http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/
如果你正在编写一个chrome扩展,你也许可以使用这样的标签:
<input type="text" x-webkit-speech />它添加了麦克风按钮,并使用谷歌的云语音识别来填充文本框中用户所说的话。
https://stackoverflow.com/questions/7764661
复制相似问题