我希望写一个应用程序,将语音转换为文本,反之亦然,为仓库应用程序。主要的用例是,操作员将在仓库中佩戴耳机,将指令发送回服务器,并从仓库软件接收指令来挑选和打包订单。我们将使用Windows Mobile驱动的耳机,这样它就可以录制语音指令,并将其发送到服务器以解析为文本。有人能解释一下这些技术提供了什么,它们涵盖了哪些推荐的场景吗?1)统一通信托管API
2) Speech Ser
声明可以实现自定义语音操作。举的例子如下:显然,这不是一个 (拍照,设置警报等)。但是,对于如何实现自定义语音操作,似乎没有任何解释,该页面神秘地指出:
Note: We are not accepting requests for Custom Voice Actions.这是否意味着定制语音操作根本不可能--或者它们需要得到Google的特别批准?我想要实现一个自定义的语音动作,这样我就可以说出一个自定义短语,比如Ok Google, Foo