对于那些在语音领域工作的人来说,你们使用什么作为IVR平台?我使用的是Microsoft Speech Server 2007。一些等价的包是什么?是否有人使用开源软件来处理入站或出站呼叫?请注意,我不仅仅是在谈论语音识别,它是一个综合软件包的一个组件。语音识别平台将包括语音识别、文本到语音转换、诸如VoiceXML之类的VUI技术,以及通过SIP或电话硬件的呼叫终止。
我目前正在为回音点开发一个自定义技能。我使用Alexa.NET开发工具包,在.net核心中使用AWS Lamda函数。其中一个意图让Alexa播放视频,这是托管在S3存储桶,但有时(随机-一次在打开技能后,一次在第4或5个视频之后),Alexa立即理解命令,但需要很长时间才能播放视频。根据cloudwatch日志,命令被解析并在几毫秒内执行lambda函数,但视频开始播放非常延迟(最多两分钟)。
REPORT RequestId: xyz Duration: 366.44 ms Billed Duration: 400 ms Memory Size: 576 MB Max Memory Us