腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
蔚蓝语翻译:如何激活识别只有当
语音
被检测到?
、
、
、
、
我目前正在开发一个实时翻译网络应用程序,允许多个参与者使用,并以多种语言分享他们的
转录
。提前感谢!
浏览 5
提问于2021-02-08
得票数 1
1
回答
对
文字
引擎的演讲:你有什么经验?
、
我刚刚试用了IBM Watson的演示,用于自动
语音
到文本的
转录
。我试着用火狐浏览器实时
转录
我的声音。大多数情况下,抄写是错误的或缺失的词。我还读到了泰德的演讲是如何
转录
的,我了解到他们是通过志愿者手工完成的。我想听听那些有演讲和
文字
引擎经验的人关于他们当前技术现状的经验。它似乎不够好的
转录
文本的动态,也不够好的
转录
文本,而没有认真的手动干预。 链接到演讲到文本演示
浏览 2
提问于2015-11-12
得票数 0
回答已采纳
1
回答
“捐赠这个
语音
邮件”和“允许自动谷歌系统分析你的
语音
邮件”是不是多余的?
如果我“允许自动谷歌系统分析您的
语音
邮件信息,以帮助提高
转录
质量”:在编辑成绩单时,是否建议检查“捐赠此
语音
信箱”选项?📷 我感到惊讶的是,当“允许自动谷歌系统分析
语音
邮件信息以帮助提高
转录
质量”时,默认情况下不会检查该选项,这让我怀疑这两种选项之间是否有任何区别。
浏览 0
提问于2014-08-12
得票数 2
回答已采纳
1
回答
Google
语音
到文本的延迟
、
、
这是一个问题,我遇到了使用谷歌
语音
文字
引擎。我目前正在以32 in块实时播放16位/ 16 kHz音频。但是在发送音频和接收记录之间平均有25秒的延迟,这违背了实时
转录
的目的。
浏览 3
提问于2018-07-26
得票数 3
回答已采纳
2
回答
语音
到文本的大型音频文件(Microsoft
语音
API)
、
、
、
、
使用Microsoft
语音
API
转录
中/大型音频文件的最佳方法是什么,每个文件6~10分钟?比如批处理音频文件的
转录
?顺便说一句,我认为Bing
语音
API和新的
语音
服务API没有什么区别,对吗? 谢谢大家!
浏览 1
提问于2018-06-11
得票数 4
回答已采纳
1
回答
我收到了不止一份Speech to text IBM云服务的最终文本
、
、
我正在Angular的一个项目中使用Speech to text服务,我正在将来自麦克风的
语音
转换为文本,当我收到
转录
时,该服务有时会返回不止一个最终的
转录
。backgroundAudioSuppressio: 0.5, }, ); 在文档中,它提到interimResults是
文字
记录数量有限的地方,但通过将其放在错误的位置,我没有收到任何
文字
记录
浏览 16
提问于2020-04-18
得票数 0
1
回答
使用Watson对文本进行连续
语音
处理
、
、
、
我以前一直在使用IBM
语音
文本服务来
转录
已预先录制的完整音频文件。然而,我现在尝试在使用说话人识别功能的同时进行实时
转录
。
浏览 2
提问于2018-02-28
得票数 1
1
回答
YouTube的自动字幕比产生了更好的效果(模型:视频,UseEnhanced: true)。这怎么可能?
、
、
、
、
这里我的谷歌
语音
设置给AI发短信以下是
语音
到文本AI:的输出文件这是视频链接:Google to Text的SRT (由YouTube分配的时间):例如 Google
文字
演讲: Represent the
浏览 5
提问于2020-10-12
得票数 4
1
回答
如何对iOS上的音频输入进行实时音节计数?
、
、
、
、
应该注意的是,说话者不会使用他们的母语,因此大多数现有的
语音
识别解决方案都无法工作。我看了一下CoreML,我也许可以用编码的音节数访问
语音
语料库,但我不确定我将如何开始训练这个模型。
浏览 6
提问于2022-11-11
得票数 0
1
回答
过滤掉某些
语音
Google Speech API
、
、
、
我正在创建一个
语音
机器人使用谷歌
语音
流API和谷歌文本到
语音
。我只希望用户的
语音
被
转录
,即使用户“中断”了voicebot的响应。如何避免voicebot
转录
自己的声音?根据我对Siri等现有
语音
机器人的测试,当使用扬声器时,“过滤”某些声音的能力似乎是可行的。 谢谢
浏览 1
提问于2019-02-27
得票数 2
2
回答
是否可以在浏览器中访问实时音频流?
、
它的目标是让失聪人士在网页上输入电话号码,发起电话呼叫,实时将接收端的
语音
转录
为文本,并将响应端的文本实时转换为
语音
。我计划使用Twilio进行呼叫,捕获音频流,使用
语音
识别API
转录
语音
,并使用Twilio的文本到
语音
转换功能来转换文本。我知道Twilio没有实时
转录
的能力,我似乎也找不到一种通过twilio.connection对象访问音频流的方法。因此,我正在考虑使用Media Capture API来捕获该
语音
。这有可能吗?
浏览 3
提问于2017-02-27
得票数 0
1
回答
哪种语言无法识别的
语音
转录
方法?
我的计划是使用谷歌的云
语音
到文本来
转录
演讲,并将其通过云翻译api来检测
转录
的语言。然而,因为
语音
转文本需要在
转录
之前设置语言代码,所以我计划用不同的语言集多次运行它,并比较“置信度”值以找到最有信心的
转录
,这将通过云翻译api。 这是不是最理想的方式?或者还有其他可能的选择吗?
浏览 2
提问于2020-04-14
得票数 0
1
回答
我能在谷歌玻璃
语音
识别中使用希伯来语吗?
、
、
、
我在这里读到,玻璃里有两种声音命令:2)言论自由识别(例如“纽约第五大道”) 我希望开发一个玻璃应用程序,并使用
语音
识别。
浏览 1
提问于2014-01-29
得票数 3
1
回答
下载
语音
信箱的RingCentral接口
、
、
当有人留下
语音
信箱时,我希望让RingCentral向我发送一封电子邮件,并将
语音
信箱作为音频文件附加。RingCentral发送“通知”,并可选地发送
语音
邮件的
转录
文本,但不发送音频文件。是否可以使用RingCentral应用程序接口访问
语音
信箱音频文件(和
转录
)?
浏览 3
提问于2020-12-23
得票数 1
1
回答
你能将Google
语音
的模型版本固定在文本上吗?
、
、
我想
转录
音频使用谷歌
语音
到文本API (STT),但我需要的
转录
是一致的时间。换句话说,即使Google改进了STT模型,是否有可能将我最初使用的STT模型的版本固定下来,从而使
转录
保持一致?我正在使用Google
语音
Python客户端库。
浏览 1
提问于2021-09-10
得票数 1
回答已采纳
3
回答
语音
/音频数据转文本接口
我正在开发一个iphone应用程序,在其中我将用户的声音存储为音频文件,并希望在文本中显示。谢谢,阿良
浏览 1
提问于2009-11-06
得票数 3
2
回答
多语言youtube字幕支持
、
、
我很想找到youtube视频字幕/字幕的替代品。我希望任何人都可以开放访问,为我网站上发布的视频添加母语字幕。
浏览 0
提问于2009-09-27
得票数 1
回答已采纳
2
回答
双音
转录
替换
、
、
、
我想用 这项服务实际上是合理
转录
的。
浏览 1
提问于2012-07-13
得票数 4
回答已采纳
1
回答
直接从音频/
转录
转换为文本(
语音
识别)
、
、
、
、
需要能够转换或
转录
音频(如从.MP3,其他音频格式)包含
语音
到文本文本
转录
使用
语音
(
语音
识别)算法在高精度。有许多方法可以做到这一点,这些方法越来越准确,但都是为对着设备麦克风说出的
语音
而设计的(例如,用于web的谷歌翻译/相应的API,用于iOS的Dragon应用程序)。我需要一种直接将音频文件输入
语音
识别引擎/API的方法。不希望通过扬声器播放音频并用麦克风捕获它--长音频文件需要相当长的时间,并且会降低音频质量和最终的
转录
质量
浏览 1
提问于2014-05-26
得票数 10
回答已采纳
4
回答
颤振/飞镖:任何语言对文本的演讲(离线和连续)
、
、
、
有什么包,我可以用来创建一个应用程序,可以处理
语音
到
文字
? 其他限制:在iOS上,默认情况下,插件配置为法语、英语、俄语、西班牙语和意大利语。
浏览 18
提问于2019-09-23
得票数 5
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券