我发现在对话结束之前,用户必须做出响应是有限制的:
"Your response must occur within about 5 seconds or the Assistant assumes your fulfillment has timed out and ends your conversation."
但是,是否存在用户可以响应的最大值(输入语音)?我们希望允许更长的响应(然后访问响应文本)。
理想情况下,我们希望无限制的响应时间和能力,以访问原始输入(类型语音)时收到
如果我们可以从用户的回复中获取音频,那就太好了,但据我所知,这是不可能的。
我的目标是使用一个语音到文本模型来处理几个视频。
令人困惑的是,谷歌有两款产品似乎都在做同样的事情。
这些产品的主要区别是什么?
Google语音到文本:
- Speech-to-Text has an "enhanced video" model for interpreting the audio.
谷歌视频智能:
- VI has the option to request a `SPEECH_TRANSCRIPTION` feature
我正在从XP迁移到64位Windows 7。我在XP机器上编译的应用程序在XP上运行正常。但是,当我在我的W7机器上运行exe时,GetVoices返回的声音列表如下:
Microsoft Anna
Microsoft Mary
Microsoft Mike
示例TTS语音。
检查W7 Speech属性对话框显示,机器上只加载了Microsoft Anna。在HKEY_LOCAL_MACHINE/SOFTWARE/Microsoft/Speech/Voices上检查注册表确认了这一点。
在我的新的Windows7开发机器上重新编译我的应用程序会创建一个重复上述行为的exe。(在W7下执行时,X
请描述您的问题
标题:2017腾讯云11.11大促 给你实实在在的优惠
地址:https://cloud.tencent.com/act/double11
浏览器信息
Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36