这一次,我想将watson-voice-bot重新生成日语版,这是IBM Cloud的开放源码。然而,很长一段时间以来,我尝试了很多东西,但他们只会说英语。这段代码是使用三个服务的apis编写的: speech to text、text to speech和watson assistant。主要功能是一个聊天机器人,它在网站上获取人类的声音,人工智能通过语音做出响应。
现在可以确定的是,在源代码<
我正在编写一个简单的python程序,该程序获取一个文本文件,然后使用IBM Watsontext To Speech将其转换为音频,然后使用playsound等模块直接播放音频。大多数教程只向您展示了如何将结果保存到文件中,而不是如何将其传递给播放音频的模块 from ibm_watson import TextToSpeechV1
from ibm_cloud_sdk_core.authenticatorsimport IAMA
我们遇到了一个奇怪的watson API行为。
我们正在使用Watson的speech- to -text来转录音频文件,最近升级到了更新版本的pythonsdk。它主要发生在我们的临时服务器上,并且在我们的本地环境中大部分时间都工作得很好(我们只能在多次尝试中重现它一次)。我们的逻辑假设在每个请求之前创建新会话。我们在使用watson-dev
我正在尝试通过IBM watsonspeech to text api获取扬声器标签。在我的最终输出中,我希望它显示整个音频的文字记录、置信度和扬声器标签。我的代码如下: import jsonfrom ibm_watson import SpeechToTextV1
from ibm_watson.websocketimport Recogni