我们能够记录语音邮件与Twilio语音和Node.js,我们有录音的网址。我们需要这份录音传送到用户的语音邮件收件箱(载体方)。
这就是我们到目前为止所得到的。
记录端点:
twiml.say('Please leave a message on the call.\nPress the star key when finished.');
twiml.record({
action: `${serverURL}/voiceHangup`,
method: 'POST',
timeout: '180',
max
我发现在对话结束之前,用户必须做出响应是有限制的:
"Your response must occur within about 5 seconds or the Assistant assumes your fulfillment has timed out and ends your conversation."
但是,是否存在用户可以响应的最大值(输入语音)?我们希望允许更长的响应(然后访问响应文本)。
理想情况下,我们希望无限制的响应时间和能力,以访问原始输入(类型语音)时收到
如果我们可以从用户的回复中获取音频,那就太好了,但据我所知,这是不可能的。
我能够将安卓小部件与Google Assistant集成起来。想要有一些语音指挥的经验。
例如,CREATE_CALL意图,如果用户试图通过说call Alice with some app来呼叫Alice,如果我的应用程序中有2个call Alice with some app,那么我是否可以用一个小部件来响应,显示2个Alice,然后逐个询问用户,用户可以选择真正调用哪一个,都是通过语音调用的?它能用 API来完成吗?
我一直在使用谷歌语音识别的Python。下面是我的代码:
import speech_recognition as sr
r = sr.Recognizer()
with sr.Microphone() as source:
print("Say something!")
audio = r.listen(source)
print(r.recognize_google(audio))
虽然识别非常准确,但它需要大约4-5秒才能吐出识别出的文本。因为我正在创建一个语音助手,所以我想修改上面的代码,以使语音识别速度更快。
有没有办法把这个数字降到大约1-2秒?如
对于那些在语音领域工作的人来说,你们使用什么作为IVR平台?我使用的是Microsoft Speech Server 2007。一些等价的包是什么?是否有人使用开源软件来处理入站或出站呼叫?请注意,我不仅仅是在谈论语音识别,它是一个综合软件包的一个组件。语音识别平台将包括语音识别、文本到语音转换、诸如VoiceXML之类的VUI技术,以及通过SIP或电话硬件的呼叫终止。