我被要求在我们的产品中开发一个文本到语音的模块,它应该支持各种文本到语音的引擎。
是否有标准描述如何与第三方TTS(文本到语音)服务或ASR(自动语音识别)服务接口?
发布于 2012-06-27 21:12:21
大多数ASR使用Media Resource Control Protocol (MRCP)作为其接口的标准。它也可以用于TTS。
发布于 2012-07-13 13:55:44
这取决于您的目的或您将在其中使用ASR和TTS的领域。
如果您要在呼叫中心等IVR (交互式语音响应)应用程序中使用MRCP,则可以使用MRCP来控制ASR、TTS媒体资源,在这种情况下,您可以将MRCP服务器与CISCO和VXML服务器等语音网关连接。一个著名的和常见的MRCP实现是unimrcp,它是协议的C实现,是一个很好的和稳定的开源项目。
但最后,这取决于你的目的,正如我所说的,你可能永远不需要使用MRCP,如果你的TTS引擎可以单独工作,你可以使用它作为一个独立的服务器。
著名的开源文语转换引擎是用Java编写的Mary TTS,用C++编写的Festival。
著名的开源ASR引擎有用Java语言编写的cmu Sphinx4,用C语言编写的Julius。
https://stackoverflow.com/questions/11218563
复制相似问题