IBM watson语音到文本集成

IBM Watson语音到文本集成是一种基于云计算的语音识别服务，它可以将语音转换为文本形式。以下是对该问答内容的完善和全面的答案：

概念： IBM Watson语音到文本集成是IBM Watson人工智能平台中的一个功能模块，它利用深度学习和自然语言处理技术，将音频文件或实时语音转换为可编辑和可搜索的文本。

分类： IBM Watson语音到文本集成属于自然语言处理（NLP）和语音识别领域。

优势：

高准确性：IBM Watson语音到文本集成采用先进的语音识别算法和模型，能够实现高准确性的语音转文本转换，减少了人工干预的需求。
多语种支持：该集成支持多种语言的语音转文本转换，可以满足全球范围内的语音识别需求。
实时性：IBM Watson语音到文本集成可以实时处理实时语音流，适用于需要实时转换语音为文本的场景，如实时字幕生成、电话会议记录等。
可扩展性：作为云计算服务，IBM Watson语音到文本集成具有良好的可扩展性，可以根据用户需求进行灵活的资源配置和扩展。

应用场景：

语音转写：可以将会议记录、讲座、采访等语音内容转换为文本，方便后续整理、检索和分析。
实时字幕生成：可以将实时演讲、直播等场景中的语音内容实时转换为字幕，提供给听障人士或需要静音观看的用户。
语音搜索：可以将语音指令或语音查询转换为文本，用于搜索引擎、智能音箱等应用中。
语音助手：可以将用户的语音指令转换为文本，用于智能助手、智能客服等应用中。

推荐的腾讯云相关产品和产品介绍链接地址：腾讯云提供了类似的语音识别服务，可以参考腾讯云的语音识别产品“语音转写”（https://cloud.tencent.com/product/asr）进行更详细的了解和使用。

为了避免BadRequestException，沃森服务不支持的所有符号都是什么

、、、

我目前使用的是由Java SDK提供的IBM Watson的文本到语音API。代码如下 TextToSpeech textToSpeech = new TextToSpeech(); textToSpeech.setUsernameAndPassword(username, password); ServiceCall<InputStream> inputStreamServiceCall = textToSpeech.synthesize(text, Voice.EN_ALLISON, AudioFormat.OGG); InputStream in = inputStream

浏览 3提问于2017-03-21得票数 0

回答已采纳

1回答

使用set_detailed_response的问题- ibm watson python sdk

、、

当从IBM-cloud python SDK的2.10.4版本更改到新的3.0.4版本时，我不能再使用set_detailed_response(False) 使用watson python SDK利用IBM_watson助手、文本到语音、语音到文本和视觉识别服务。当SDK更新到2.0版本时，所有方法的默认响应都更改为DetailedResponse (https://pypi.org/project/ibm-watson/#changes-for-v20)。这个DetailedResponse的一个问题是它是不可迭代的，这对于我的情况是必要的。幸运的是，SDK提供了一种使用set_deta

浏览 14提问于2019-06-26得票数 0

回答已采纳

1回答

使用IBM Watson实现文本到语音转换的简单Python代码

、、

我一直在寻找可以帮助我在pycharm中使用ibm watson进行文本到语音转换的代码。请尽快帮助我

浏览 0提问于2020-05-12得票数 1

2回答

在bluemix上使用python调用服务

、、、

我在IBM Bluemix平台上使用python。如何调用文本到语音转换Watson服务？我的python代码中有这个字符串，我需要传递要读取的文本。

浏览 2提问于2016-03-06得票数 4

1回答

如何检查两个文本之间的平衡准确性？

、、

我在IBM的Watson API和我自己的API上测试了一些语音文件。例如，文本1:从IBM的Watson API获得。文本2:从自己的API获取。我想检查text2相对于text1的准确性。

浏览 1提问于2022-08-09得票数 -1

1回答

使用IBM watson进行实时RTP/VOIP/音频呼叫时，语音转文本不会转换为文本

、、、

我正在尝试使用IBM watson service的语音转文本服务，但我在将语音转换为文本时遇到了一些问题。你能在下面的场景中帮我一下吗？我已经设置了VOIP(Asterisk/freeswitch)服务器，注册了VOIP客户端和VOIP客户端，A呼叫B，呼叫建立，他们正在使用G711 ULAW编解码器接管电话。我有连接到IBM watson speech to text并建立会话的websocket应用程序。我从watson服务器得到的回复是"State listening“。我一直在通过watson服务器的websocket连接发送RTP数据包的原始数据。请帮我解决

浏览 2提问于2018-03-30得票数 0

0回答

如何在一个服务中连接多个IBM watson服务？

在IBM Watson中，我想使用两个服务，即语音到文本和会话，我想在这些服务之间进行通信。如果我独立地使用这项服务，我需要调用语音转文本，然后调用会话，即增加了网络周期。有没有办法将这些服务保存在容器中，并且我只在调用之后才调用容器，我的语音转文本和会话在内部相互通信，而不是对每个服务进行显式调用。

浏览 9提问于2017-01-02得票数 0

2回答

用于纯jquery/javascript的ibm watson speech to text api

、、、、

我完全不熟悉IBM Watson Speech- to -Text，也不擅长从html向服务器发送实时音频文件。其目的是将语音转文本(免费版本)集成到web应用程序中，以便进行口述和笔记。我之前已经实现了HTML speech api，但是组织似乎对它的准确性水平并不满意。到目前为止，我只看过他们的演示，它似乎表明实时转录是一种可能性，但我似乎找不到可以使用的示例代码。为此，我主要打算使用javascript代码(然而，该应用程序是用ASP MVC 3构建的)。如果能给出任何指导或任何在免费使用的web应用程序中实现语音到文本的分步指南，那将是一个很大的帮助。感谢您的帮助。

浏览 0提问于2016-10-27得票数 2

1回答

语音识别(IBM)用户名和密码

、、、

我希望在没有- curl或ibm_watson模块的情况下使用IBM语音识别服务。我的尝试如下： import speech_recognition as sr r = sr.Recognizer() text = r.recognize_ibm(audio,username='',password='') 即使我有IBM云语音文本的“服务凭据”，我也找不到该函数的正确形式。在recognize_ibm()的文档中，有人说我需要输入才能找到格式的username。但是link_1坏了。在哪里可以找到username和password？我还尝试了text

浏览 4提问于2022-04-10得票数 0

回答已采纳

2回答

ibm watson text to speech api创建暂停

我使用的是ibm watson的text-to-speech api，如何通过文本生成稍长一点的停顿？我想在文本中插入暂停或静默，这样当watson将文本转换为语音时，会有明显的暂停或1秒或2秒？

浏览 2提问于2016-03-16得票数 2

1回答

IBM对文本身份验证失败的讲话

、、、

嗨，我在Ibm创建了一个新的服务，用于语音到文本。但是，当我使用“服务凭据”时，我会得到以下错误： “错误Domain=com.ibm.watson.developer-cloud.WatsonDeveloperCloud Code=0”无法获得身份验证令牌。请检查凭据。UserInfo={NSLocalizedFailureReason=Failed以获取身份验证令牌。检查凭据.} 添加一下，通过IBM在“服务访问授权”中显示如何解决此身份验证问题？

浏览 2提问于2016-06-10得票数 1

2回答

IBM令牌对所有服务都有好处，还是特定于每个服务，例如语音到文本？

、、、

IBM的表示，下面的节点后端代码使您能够使用Use the API key to have the SDK manage the lifecycle of the token. The SDK requests an access token, ensures that the access token is valid, and refreshes it if necessary. const SpeechToTextV1 = require('ibm-watson/speech-to-text/v1'); const { IamAuthenticator } = requi

浏览 4提问于2020-03-13得票数 1

回答已采纳

2回答

沃森唤醒语音命令

、

我正在考虑使用沃森的发言文字软件，以帮助驱动我们的产品的语音命令。我看到的所有示例都要求用户在发出命令之前按下按钮。但是，我不想让用户按一个按钮，我想要一个“唤醒词”或关键字来表示我们产品的命令开始。也就是说，我不想把声音源源不断地流到Watson的语音到文本软件，但是我正在寻找一种方法，让用户提供一个关键字或唤醒词开始发送声音，然后让Watson的讲话返回它听到的命令的文本。例如，"OK，Google“开始向Google发送语音到文本。 IBM提供了一种方法来创建我自己的"OK，Google“关键字，而不必将我的应用程序可能听到的所有内容发送到文本中吗？

浏览 0提问于2018-01-29得票数 2

回答已采纳

1回答

语音通话中的Android语音到文本

、、

您好，有可能在呼叫中具有语音到文本选项，其中呼叫的接收者将获得该呼叫的实况记录。我试图阅读IBM Watson的Speech to Text服务，但无济于事，因为它只有关于已经记录的数据的说明。有人能帮我吗?或者这是不可能的？

浏览 9提问于2019-02-01得票数 0

1回答

如何修复服务被cors策略阻塞的问题:请求的资源上没有‘access-control-allow- resource’头部

、、、

我试图在NodeJs应用程序中访问IBM Watson提供的文本到语音转换服务，但我看到访问拒绝错误，因为该服务已被CORS策略阻止。已尝试在app.js中设置相关标头的所有方法，但无法解决问题。 https://cloud.ibm.com/apidocs/text-to-speech?code=node app.use(function(req, res, next) { res.header("Access-Control-Allow-Origin", "http://localhost:3000"); res.header("Access

浏览 15提问于2019-04-06得票数 1

2回答

如何将Watson IOT服务集成到Hyperledger Fabric？

、、

由于IBM不再为IBM Blockchain提供免费计划，因此我提出了将Watson IOT集成到Hyperledger Fabric而不是IBM Blockchain的解决方案。我找到了这篇文档，它说Watson区块链集成支持连接到IoT blockchain fabrics和Hyperledger fabrics 但我找不到任何指导方针。有人能帮上忙吗？

浏览 1提问于2017-10-30得票数 0

2回答

IBM Watson speech to text api能否识别不同的口音？

、、

我正在尝试使用IBM Watson speech to text api。这个api能识别不同的口音吗？有没有办法教不同的口音，比如印度口音？在Windows中，对于语音识别，口音识别是通过提供一些样本语音来理解人的口音来完成的。IBM Watson中有类似的方式吗？

浏览 2提问于2016-11-23得票数 0

1回答

IBM语音到文本“无法转换数据流音频/webm ->音频/x浮动数组”媒体MIME类型

、、、、

我正在使用mediaDevices.getUserMedia()在Chrome中录制短音频文件(几秒钟)，将文件保存到Firebase存储中，然后尝试将这些文件发送到IBM语音到文本。我要返回这条错误消息： unable to transcode data stream audio/webm -> audio/x-float-array 在浏览器中设置麦克风： navigator.mediaDevices.getUserMedia({ audio: true, video: false }) .then(stream => { var options = { audioBi

浏览 0提问于2020-03-18得票数 1

1回答

比较React原生TTS和STT工具

、

我有一个反应原生移动应用程序，并想添加语音识别到它(兼容IOS和android)。我在网上搜索了所有可能的工具，找到了以下内容：对于语音转文本(STT)： 1.react-native-voice 2.RNSpeakChat 3.Using Google Cloud 4.SpeechRecognizer 5.react-native-watson 6.react-speech-recognition 7.react-native-speech-recognition 对于文本到语音(TTS)： 1.react-native-tts 2.react-native-watson

浏览 0提问于2019-12-05得票数 2

1回答

Watson Speech to Text -状态: 401，错误:未授权

、、、

我试图在我的聊天机器人中集成语音到文本服务，但收到标题中提到的错误。我只是使用了文档中描述的服务。他们将授权方法从用户名+密码更改为api密钥，对吗？这是我得到的错误： Feb 26, 2019 11:18:38 AM okhttp3.internal.platform.Platform log INFO: --> POST https://stream.watsonplatform.net/speech-to-text/api/v1/recognize http/1.1 (-1-byte body) Feb 26, 2019 11:18:40 AM okhttp3.internal.

浏览 16提问于2019-02-26得票数 0

1回答

是否有可能将ibm和结合起来？

、、、

我需要这两个API，因为在IBM中，watson有这样一个特性，即在识别说话人方面，但是在将语音转换为文本过程中，准确性并不是很准确。虽然在中，语音转换成文本的效果更好，但是他们可以识别英语-菲律宾口音，但是在识别说话者时，IBM有更好的效果。我想要创建一个演讲文本应用程序，可以识别发言者。我的问题是，IMB和是否有可能被合并？

浏览 1提问于2019-04-01得票数 1

回答已采纳

2回答

IBM文本到语音抛出“403:禁止”错误

、、、

我正在尝试将IBM用于文本到语音服务。如果我使用curl命令，该服务就能工作，但是当我尝试使用Python使用srrvice时，它会将我抛出错误下面。 "/anaconda3/lib/python3.6/site-packages/ibm_cloud_sdk_core/base_service.py"，跟踪(最近一次调用)：文件第234行，在发送response.status_code、error_message、http_response=response中)错误:禁用，代码: 403方法失败，状态代码403:禁用下面是curl命令 curl -X GET -u "

浏览 1提问于2020-03-22得票数 2

1回答

Twilio:访问IBM Watson语音到文本结果的有效载荷

、、、

新的Twilio开发者来了。我的应用程序使用IBM语音到文本插件，但我在访问回调中的结果有效负载时遇到了困难。我在论坛上找不到有用的文档或任何关于这个问题的讨论。我知道的/我试过的有效负载资源存在-我可以通过浏览器直接访问它。使用Twilio库客户端规定的语法返回一个“坏请求”错误： $request =$client->v1->查找->phoneNumbers("+1XXXXXXXXXX") ->fetch(数组( "AddOns“=> "ibm_watson_speechtotext”))；使用cURL直接获

浏览 3提问于2017-01-26得票数 1

回答已采纳

1回答

使用他们的TTS和STT创建一个简单的IBM助手。我得到了一个字节和字符串错误。我正在使用VLC播放音频。我怎么才能解决这个问题？

、、、、

这是密码。它的目的是在Python中使用VLC将IBM的文本转换为语音。对助理来说这是我的第一步。这个问题不同于常规的字符串和字节错误，因为它涉及IBM，而不是简单的程序错误。 import vlc from ibm_watson import TextToSpeechV1 from ibm_cloud_sdk_core.authenticators import IAMAuthenticator authenticator = IAMAuthenticator("API Key Here") text_to_speech = TextToSpeechV1( auth

浏览 2提问于2020-05-12得票数 0

回答已采纳

4回答

如何在Unity中使用IBM Watson的文本到语音转换功能？

、、、、

我正在做一个简单的应用程序，用Unity SDK来试用Watson的TTS。我唯一的问题是，几乎没有在线资源来帮助实现这一目标。我在网上找到了一段代码，但当我在我的应用程序中尝试它时，它不能工作，因为它被弃用了。几乎所有使用watson的文本到语音转换示例都使用名称空间IBM.Watson.DeveloperCloud.Services.TextToSpeech.v1;，该名称空间碰巧已被弃用且不再可用。我想知道是否有人可以帮助我找出/提供代码或链接，可以帮助我弄清楚如何使用Watson的TTS和Unity，这是不推荐使用的。任何帮助都将不胜感激。

浏览 28提问于2019-09-10得票数 0

1回答

我能否将IBM Cloudant数据库连接为Twilio IBM STT附加服务的回调URL？

、、、、

我有一个Watson语音助手实例，它使用SIP干线连接到Twilio API。我想从Twilio Marketplace启用IBM Speech- to -Text附加组件，它将允许我获得拨打Watson Assistant机器人的电话呼叫的完整文本。我想将这些副本存储在我在IBM Cloud中创建的Cloudant数据库中。我能否将Cloudant数据库的端点用作Twilio附加组件的回调URL，以便在激活附加组件时，将转录内容作为文档添加到Cloudant数据库中？似乎我应该能够在IBM Cloud中通过IBM Cloud的STT服务调用trancsription服务，但由于我的助手是

浏览 13提问于2019-05-23得票数 0

1回答

通过公司代理从Java调用Watson语音到文本

我正在使用来自github ()的Watson来运行语音到文本服务的测试。我正在我的工作场所运行一个例子，它有一个防火墙和一个http代理设置。测试失败，因为无法到达远程服务器。堆栈跟踪如下： Exception in thread "main" java.lang.RuntimeException: java.net.UnknownHostException: stream.watsonplatform.net at com.ibm.watson.developer_cloud.service.WatsonService$1.execute(WatsonServic

浏览 2提问于2017-01-17得票数 2

回答已采纳

1回答

在资源路径中找不到本机库(com/sun/jna/android-aarch64/libjnidispatch.so)

、、、

我正在尝试使用IBM的Android语音到文本库。我注意到有一个类似的问题，，但没有给出答案。我已经集成了所有内容，但是当尝试启动识别服务时，它会得到以下错误： java.lang.UnsatisfiedLinkError: Native library (com/sun/jna/android-aarch64/libjnidispatch.so) not found in resource path (.)

浏览 1提问于2016-07-23得票数 2

回答已采纳

1回答

对于android和IOS来说，最好的移动“文本到语音”和“语音到文本”工具是什么？

、、

你能帮我找出最好的android和IOS的移动“文本到语音”和“语音到文本”工具吗？我在网上搜索，发现了一些工具，例如：对于语音转文本(STT)： 1.react-native-voice 2.RNSpeakChat 3.Using Google Cloud 4.SpeechRecognizer 5.react-native-watson 6.react-speech-recognition 7.react-native-speech-recognition 对于文本到语音(TTS)： 1.react-native-tts 2.react-native-watson 3

浏览 16提问于2019-12-18得票数 0

回答已采纳

1回答

使用watson developer云和react本机

、、

我正在尝试将我已经创建的into聊天机器人集成到我的本机移动应用程序中。每当我导入watson-developer-cloud时，我都会看到一个错误，即Node.js标准库(如流)与世博不兼容。我见过其他人使用watson服务来创建语音到文本应用程序。我不明白他们是如何在没有watson-developer-cloud包的情况下使用服务的。我见过一些社区创建的包，比如react-native-watson，据说可以实现这一点，但我无法让它们发挥作用。我有没有办法让这件事成功，还是不可能？欢迎并感谢任何建议。

浏览 0提问于2018-07-18得票数 0

1回答

如何在Python中接收Watson Speech to Text SDK的完整输出？

、、

经过大量测试，我能够从我在python中创建的应用程序收到输出，该应用程序使用IBM bluemix将语音转换为文本。代码： import json from os.path import join, dirname from ibm_watson import SpeechToTextV1 from ibm_watson.websocket import RecognizeCallback, AudioSource import threading from ibm_cloud_sdk_core.authenticators import IAMAuthenticator authent

浏览 23提问于2020-01-31得票数 2

回答已采纳

1回答

对文字引擎的演讲:你有什么经验？

、

我刚刚试用了IBM Watson的演示，用于自动语音到文本的转录。我试着用火狐浏览器实时转录我的声音。大多数情况下，抄写是错误的或缺失的词。我还读到了泰德的演讲是如何转录的，我了解到他们是通过志愿者手工完成的。我想听听那些有演讲和文字引擎经验的人关于他们当前技术现状的经验。它似乎不够好的转录文本的动态，也不够好的转录文本，而没有认真的手动干预。链接到演讲到文本演示

浏览 2提问于2015-11-12得票数 0

回答已采纳

1回答

说话人识别vs说话人识别google cloud vs microsoft azure vs ibm watson vs aws转录

、、、、

我想做一个语音到文本分析的项目，我想要1)说话人识别，2)说话人二元化，3)语音到文本。现在我正在测试为微软，谷歌，亚马逊，IBM等公司提供的各种API，我发现在微软，你可以选择用户注册和说话人识别()，但是，所有其他平台都有说话人二值化，但没有说话人识别。在扬声器二元化中，如果我理解正确，它将能够“区分”用户，但它如何识别，除非我不注册他们？我在azure中只能找到可用的注册选项但我想确认一下，所以我想在这里检查一下，也许我看到的是正确的文档，或者在Google cloud、Watson和AWS转录中有其他方法来实现这一点。如果是这样的话，你们能帮我吗？

浏览 0提问于2020-01-20得票数 0

1回答

Python中的实时语音到文本转录

、、、

这是我的第一篇文章，所以我希望它是好的。我正在开发一款覆盆子Pi Zero W，我正在尝试制作一个实时的语音到文本的翻译器。我已经研究过了，我认为我需要使用SpeechRecognition模块，我一直在做这件事，最终我写了一个程序来做我需要的事情，使用谷歌语音到文本模块，它只是做了不现实的工作。我认为对于我来说，为了让它实时转录，我需要使用IBM Watson Speech来使用名为Websockets的东西发送文本。我似乎找不到很多关于这两者的信息，更不用说任何代码了，如果你们中的任何人有使用Python将live转录为文本的经验，我将非常感激，如果你们能给我指出正确的方向，任何代码都

浏览 28提问于2021-02-01得票数 0

回答已采纳

1回答

如何在node.js中使用沃森文本到语音api？

、、、

我是一个使用特快和node.js的初学者。我对如何使用Watson api感到困惑，我几乎无法理解文档/api。我只想尝试在我的应用程序中使用watson api。所以我会列举我做了什么，我被困在哪里。首先，我在命令行执行这个命令，以获得框架。 express test 然后，我使用以下命令安装了依赖项。 cd test && npm install 然后我通过命令安装了watson npm install watson-developer-cloud 然后，我将这些代码放在我的app.js文件中。 var TextToSpeechV1 = require('wats

浏览 4提问于2016-08-24得票数 0

回答已采纳

1回答

在Unity中访问Watson intents

、

我有Watson 2.7.0 speech-to-text，Assistant，text-to-speech服务我的工作区包含提供一般语音响应的一般意图；以及在Unity中执行动作的“action”意图。我在自己的脚本中复制了Watson Cardboard vr示例中的代码，但发现我无法访问意图。它一直给我下面的错误。我的脚本在没有“action”意图部分的情况下工作得很好。我遗漏了什么？ Type `IBM.Watson.DeveloperCloud.Services.Assistant.v1.MessageResponse' does not contain a defini

浏览 0提问于2018-09-14得票数 0

1回答

收到错误：[SSL: BAD_LENGTH]长度错误(_ssl.c:2408)

、、、、

我做了一个可以通过语音控制的游戏。为了将所有的语音命令转换为文本，我使用了IBM Cloud Speech To text服务。一切都完成了，除了它显示了错误的长度错误，正如您在图像中看到的那样。这是语音转文本的代码： ############################################### #### Initalize queue to store the recordings ## ############################################### CHUNK = 1024 # Note: It will discard if th

浏览 238提问于2020-05-29得票数 0

1回答

Watson语音到文本服务延迟

、、、

我有一个Python脚本，它使用音频文件和沃森语音到文本服务，并打印识别的成绩单和信心。是否有Watson服务计算的“延迟”值可以打印出来？我已经有一个Python脚本来计算自己的延迟，只是想知道Watson是否提供了这个数字，以便我可以将其与其他语音到文本服务的延迟进行比较。谢谢!

浏览 2提问于2018-01-12得票数 0

1回答

在React Native中播放来自变量的音频

、、、、

我是react native的新手，我正在尝试编写一个POC，其中我使用了Watson-IBM的文本到语音功能。该服务来自IBM，它有一个HTTP REST接口，由我提供文本，它会将包含文本音频的.wav (例如)文件返回给我。因此，在某种程度上，我将“音频”保存在一个变量中。现在我需要播放这段音频。我已经找到了一些可以播放这个音频的库。然而，它们中的大多数都需要一个带有路径的“真实文件”才能播放音频。然而，在我的例子中，我没有“真实文件”(例如，“真实文件”，我指的是项目文件夹中的文件)。对于此信息，我只有一个变量。我可以将这个变量保存到一个文件中，然后从这个文件中读取，但我不确定

浏览 0提问于2018-02-27得票数 0

1回答

沃森对文本的讲话:无效的凭据错误(代码: 401)

、、、

我正在尝试在下面的Python程序中使用IBM演讲来文本API/service。 import json import os import sys from watson_developer_cloud import SpeechToTextV1 def transcribe_audio(audio_file_name) : IBM_USERNAME = "yourusername" IBM_PASSWORD = "yourpassword" #what changes should be made here instead of

浏览 0提问于2019-03-19得票数 0

回答已采纳

1回答

与google hangouts和ibm watson集成

、、、

有没有什么方法可以将Google hangouts与IBM watson集成在一起……我已经通过node js创建了一个机器人，我想将该机器人与google hangouts连接起来，从ibm watson获取对话

浏览 1提问于2017-07-06得票数 1

2回答

IBM Watson对话没有在facebook messenger中显示欢迎消息

、、

我将IBM Watson对话集成到facebook messenger中，但它没有显示欢迎消息(对话的第一个节点)。我能做些什么来解决这个问题？非常感谢!

浏览 15提问于2019-05-15得票数 0

1回答

通过IBM Voice Gateway以编程方式发起呼叫

、、、、

我已经将IBM Voice Agent ()与Watson Assistant和Twilio号码连接起来。我可以拨打我的Twilio号码，并与助手进行对话。但是，现在我不希望用户呼叫该号码，而是希望以编程方式触发呼叫。调用一些API来强制助手呼叫某个号码。理想情况下，传递一些上下文... 我知道语音代理使用幕后语音网关()。更新：我可以通过via Twilio触发一个电话。我请Twilio充当中间人。Twilio将呼叫我的号码和SIP (语音代理)并桥接呼叫。但是，我无法将任何初始参数传递给Watson Assistant，因为我无法控制进程……

浏览 13提问于2018-08-08得票数 3

1回答

需要IBM Watson AlchemyLanguage Python SDK完整示例

、

我正在努力寻找IBM Watson AlchemyLanguage Python SDK和IBM Watson Retrieve and Rank Python SDK的端到端示例代码。我确实有来自每个SDK的示例代码，但它们非常简单(只有类/函数定义)。我希望找到调用API、上传文件和调用函数的示例，例如实体、情感、文本等。

浏览 6提问于2016-06-29得票数 1

1回答

IBM Watson Speech to Text in Python在使用模型参数时给出了404

、、、、

我正在使用Python测试IBM Watson Speech to Text的使用。我能够成功地测试英语音频的转录，但当我设置model参数来更改我的语言的语言模型时，出现了404 not found错误。我已经多次查看了IBM page，它解释了模型参数的用法，但我不能理解缺少了什么。有人能帮上忙吗？我的代码： from ibm_watson import SpeechToTextV1 from ibm_cloud_sdk_core.authenticators import IAMAuthenticator api = IAMAuthenticator("my_credent

浏览 24提问于2020-10-30得票数 0

回答已采纳

1回答

Watson Speech to Text性能问题

、、

他们看到的关于Watson speech to text服务器的最新问题是，不能在单个实例中运行持续时间大于10分钟的音频文件，其次，当语音到文本服务器正在运行小于10分钟的文件时，与Watson服务器的TCP连接断开。他们基本上是在python中的Watson服务器上使用web套接字，并想了解对于持续时间较长的音频文件(例如，我们的会议持续到3个小时)，运行语音转文本的最佳方式是什么。配置通过web套接字丢失连接的瓶颈的最佳方式是什么？

浏览 7提问于2015-12-10得票数 2

1回答

(Unitation5.6) (IBM )将用户语音解析为文本，然后返回到语音

、、、

我正在尝试使用新的for Unity来获取用户的语音输入，将其解析为文本，然后将该文本传递回Watson的文本到语音，以便它能够重复用户的话。我已经使用SDK的从麦克风获取音频剪辑并将其解析为文本，与其结合使用的是从语音到文本的文本输入，并将其显示在画布上，在屏幕上显示用户的语音。然后我创建了一个UI输入字段，并将其与SpeechDisplaywidget的文本输出(以及texttoSpeechWidget的输入)相关联，然后创建一个UI按钮，单击该按钮将文本发送到语音服务。它应该将连接的文本播放到语音文件中，但是当我单击按钮时，什么都不会发生。“状态”显示只读“就绪”，永不更改，整个过程不

浏览 3提问于2017-06-27得票数 1

回答已采纳

1回答

将Watson语言翻译为Watson Assistant的最简单方法？

、

我想知道将IBM Language Translation集成到我当前的IBM Watson Assistant的最简单方法。我想我可以通过Cloud Functions做到这一点，但我不确定怎么做。我已经阅读了GitHub示例Watson应用程序，但我不清楚如何实现它。

浏览 25提问于2019-09-12得票数 1

1回答

如何从IBM Cloud Functions连接Compose for PostgreSQL？

、、、、

我使用IBM Cloud Functions将音频文件转换为文本，并使用IBM Watson speech to text服务来实现此目的。在这里，我想将文本存储到PostgreSQL数据库中。IBM Cloud Functions和Compose for PostgreSQL服务之间是否有任何连接，以便我可以将文本存储到数据库。我在云函数中使用Node Runtime。

浏览 1提问于2018-01-04得票数 0

1回答

尝试使用IBM的Watson Knowledge Studio和API构建认知机器人

、、、

我正在尝试构建一个认知机器人，我已经使用IBM Watson的Knowledge Studio训练了一个非常基本的模型，并且已经准备好部署。我还使用了IBM的Virtual Agent来进行“会话”部分，因为它似乎涵盖了最初的大部分繁重工作。我希望将经过训练的模型(来自Watson Knowledge Studio)集成或利用到Virtual agent？我看到经过训练的模型可以被部署到‘炼金术’的API中，但仍然在努力弄清楚，看看它如何适应这个难题。帮助?

浏览 0提问于2016-10-24得票数 1