我正在开发一个应用程序,它使用语音识别来帮助盲人学习音乐。为此,我正在考虑使用一些东西,比如DialogFlow.ai,,甚至是Amazon ,以避免重新启动方向盘。因此,有时我想使用原始音频数据来检查仪器是否调谐。使用这些技术,默认情况下,所有音频输入都会被解释,并最终转换为文本。那么,有没有一种方法可以使用原始音频数据而不是解释用户的语音呢?
发布于 2019-10-09 09:28:35
由于许多原因(主要是安全性),Amazon和其他类似技术将不允许您获取用户的原始输入。使用Amazon作为捕捉乐器音频输入的方法并不是实现调谐器的可行方法。您应该实现自己的方式来捕获音频,并可能使用它与Alexa/DialogFlow一起进行命令解释。
https://stackoverflow.com/questions/58283036
复制相似问题