腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
IBM
Watson
speech to text api能否
识别
不同的口音?
、
、
我正在尝试使用IBM
Watson
speech to text api。这个api能
识别
不同的口音吗?有没有办法教不同的口音,比如印度口音?在Windows中,对于
语音
识别
,口音
识别
是通过提供一些样本
语音
来理解人的口音来完成的。IBM
Watson
中有类似的方式吗?
浏览 2
提问于2016-11-23
得票数 0
1
回答
如何进行
语音
再合成将女声转换为男声
、
我看到已经有一些高级的ML项目可以进行文本到
语音
转换,比如SV2TTS:https://github.com/CorentinJ/Real-Time-Voice-Cloning 然而,我正在寻找的不是文本到
语音
,而是将
语音
重新合成为另一种声音 那么,有没有与这个主题相关的项目、软件、库可以使用呢?
浏览 81
提问于2021-01-17
得票数 0
2
回答
关键词是否影响布鲁斯沃森
语音
识别
?
、
、
沃森的
语音
识别
器支持作为参数的关键字列表,但我试图弄清楚这些关键字是否真的会影响
识别
。例如,如果您正在给
Watson
一个音频剪辑,其中包含可能无法正确
识别
的正确名称,那么将这些名称作为关键字提交会增加
Watson
正确
识别
它们的可能性吗?关键词与
识别
本身相互作用吗?
浏览 2
提问于2016-04-12
得票数 0
回答已采纳
1
回答
Watson
语音
到文本服务延迟
、
、
、
我有一个Python脚本,它使用音频文件和沃森
语音
到文本服务,并打印
识别
的成绩单和信心。是否有
Watson
服务计算的“延迟”值可以打印出来?我已经有一个Python脚本来计算自己的延迟,只是想知道
Watson
是否提供了这个数字,以便我可以将其与其他
语音
到文本服务的延迟进行比较。 谢谢!
浏览 2
提问于2018-01-12
得票数 0
1
回答
对文字引擎的演讲:你有什么经验?
、
我刚刚试用了IBM
Watson
的演示,用于自动
语音
到文本的转录。我试着用火狐浏览器实时转录我的声音。大多数情况下,抄写是错误的或缺失的词。
浏览 2
提问于2015-11-12
得票数 0
回答已采纳
7
回答
ValueError:找不到令牌种子!https://translate.google.com改变了吗?
、
、
我正在制作一个助手,使用gTTS和谷歌
语音
,但这个错误出现。这对于
语音
识别
来说是很好的,因为它可以毫无错误地
识别
。我测试了打印功能,但是当我想要文本到
语音
转换时,这个bug就来了。..。("Sorry, I did not catch that")
watson
_speak("I am offlineright now") return voic
浏览 3
提问于2020-11-05
得票数 5
1
回答
比较React原生TTS和STT工具
、
我有一个反应原生移动应用程序,并想添加
语音
识别
到它(兼容IOS和android)。我在网上搜索了所有可能的工具,找到了以下内容:1.react-native-voice 对于文本到
语音
(TTS):
浏览 0
提问于2019-12-05
得票数 2
1
回答
使用新语言模型将
语音
转换为文本
、
、
我计划为我的社区建立
语音
到文本的程序。这将是一种谷歌还不存在的新语言。我知道Javascript和PHP。
浏览 3
提问于2018-04-05
得票数 0
1
回答
是否有可能将ibm和结合起来?
、
、
、
我需要这两个API,因为在IBM中,
watson
有这样一个特性,即在
识别
说话人方面,但是在将
语音
转换为文本过程中,准确性并不是很准确。虽然在中,
语音
转换成文本的效果更好,但是他们可以
识别
英语-菲律宾口音,但是在
识别
说话者时,IBM有更好的效果。我想要创建一个演讲文本应用程序,可以
识别
发言者。我的问题是,IMB和是否有可能被合并?
浏览 1
提问于2019-04-01
得票数 1
回答已采纳
2
回答
在iPhone中实现极短词汇量
语音
识别
的快速方法
、
、
我需要一种快速的方法来执行非常小的词汇量(小到整个字典中的5个单词)的
语音
识别
。我知道很多
语音
识别
框架,比如OpenEars,ATT
Watson
speech API,Dragon等,但它需要你在阅读上投入大量的时间。由于我们的应用程序的重点不是
语音
识别
,因此我们希望以一种快速的方式完成它。我知道如果我只有5个单词,那么我也可以用5个选项来替换它们,但这是不合适的。对此有什么想法吗?谢谢。
浏览 3
提问于2012-09-14
得票数 0
回答已采纳
1
回答
使用set_detailed_response的问题- ibm
watson
python sdk
、
、
当从IBM-cloud python SDK的2.10.4版本更改到新的3.0.4版本时,我不能再使用set_detailed_response(False) 使用
watson
python SDK利用IBM_
watson
助手、文本到
语音
、
语音
到文本和视觉
识别
服务。当SDK更新到2.0版本时,所有方法的默认响应都更改为DetailedResponse (https://pypi.org/project/ibm-
watson
/#change
浏览 14
提问于2019-06-26
得票数 0
回答已采纳
1
回答
如何使用Python客户端在IBM
Watson
Machine learning中部署Pytorch模型
、
、
、
我找不到任何在IBM
Watson
中部署PyTorch模型的好参考资料。我已经从Hugging transformers库创建了Bert模型,并使用Pytorch实现。现在,我需要在IBM
watson
中部署PyTorch模型以进行实时预测。 我已经搜索了很多,但没有找到任何部署步骤的参考资料。
浏览 0
提问于2020-09-22
得票数 0
2
回答
React-将本地
语音
转换为文本
、
、
、
、
我正在尝试使用
Watson
Speech to text API在react原生应用程序中录制音频,然后将音频转换为文本。 var SpeechToTextV1 = require('
watson
-developer-cloud/speech-to-text
浏览 56
提问于2017-01-28
得票数 2
5
回答
从使用Twillio录制的电话呼叫中进行实时
语音
识别
、
、
我目前正在使用Twilio打电话,我想添加一个
语音
识别
元素,这样如果用户说了特定的短语,我的后端就可以采取特定的操作。如果您熟悉Twilio,它类似于Gather动词。它需要是实时的,因为如果
识别
有问题,用户将被提示澄清。
浏览 93
提问于2016-11-18
得票数 4
回答已采纳
1
回答
COS+离线
识别
这个是只要我在对象存储管理上传文件,后台就会自动触发
识别
,并且把结果写到cos上吗?
、
请描述您的问题地址:https://cloud.tencent.com/document/product/441/6199
浏览 170
提问于2018-03-12
1
回答
如何
下载
在
Watson
Studio中创建的文本到
语音
文件
、
、
、
、
我在
Watson
Studio中使用Text to Speech。输出文件为“.wav”。有没有人知道文件存放在哪里?我想把它从IBM云
下载
到我的pc上。我该怎么做呢?我已经搜索了整个云存储,但找不到
语音
文件。
浏览 25
提问于2020-03-29
得票数 0
回答已采纳
1
回答
说话人
识别
vs说话人
识别
google cloud vs microsoft azure vs ibm
watson
vs aws转录
、
、
、
、
我想做一个
语音
到文本分析的项目,我想要1)说话人
识别
,2)说话人二元化,3)
语音
到文本。现在我正在测试为微软,谷歌,亚马逊,IBM等公司提供的各种API,我发现在微软,你可以选择用户注册和说话人
识别
(),但是,所有其他平台都有说话人二值化,但没有说话人
识别
。在扬声器二元化中,如果我理解正确,它将能够“区分”用户,但它如何
识别
,除非我不注册他们?我在azure中只能找到可用的注册选项 但我想确认一下,所以我想在这里检查一下,也许我看到的是正确的文档,或者在Google cloud、
浏览 0
提问于2020-01-20
得票数 0
1
回答
Facebook信使机器人-对文本的演讲
、
、
、
、
最近,我添加了一个很酷的功能-
语音
识别
。但是,我收到Facebook的音频附件作为mp4文件的url,没有一个熟悉的
语音
2文本api (Google,
Watson
等)支持mp4,所以我必须把它转换成FLAC,然后我可以得到成绩单。有支持mp4的
语音
2文本api吗?或者有其他方法从Facebook获得FLAC音频? 谢谢!
浏览 3
提问于2017-07-13
得票数 1
1
回答
离线
语音
的SDK入口在哪里?
、
请问离线
语音
识别
SDK的
下载
入口有吗 2. 请问有离线
语音
识别
的android demo吗 有的话
下载
链接在哪里
浏览 1050
提问于2019-06-06
2
回答
在定制Android应用程序中运行带有
语音
识别
的功能
、
、
、
、
我有兴趣制作一个Android应用程序,它用声音命令启动功能(例如:不要点击按钮,而是使用
语音
命令)。我的想法是使用
语音
识别
将结果存储在变量中,如果结果与关键字集相对应,函数就会启动。我有两个问题: 如何利用
语音
识别
的结果达到我的目的?谢谢你的帮忙
浏览 9
提问于2016-11-11
得票数 2
点击加载更多
相关
资讯
揭秘MIT-IBM Watson AI,如何教机器识别行为
如何语音识别翻译?语音识别翻译软件哪个好?
在线语音识别和离线语音识别各有哪些特点
语音识别小车
语音识别文字是怎样识别?
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券