腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(5208)
视频
沙龙
1
回答
哪种语言无法识别的
语音
转录
方法?
我正在尝试建立一个
软件
,可以识别正在说的语言。我的计划是使用谷歌的云
语音
到文本来
转录
演讲,并将其通过云翻译api来检测
转录
的语言。然而,因为
语音
转文本需要在
转录
之前设置语言代码,所以我计划用不同的语言集多次运行它,并比较“置信度”值以找到最有信心的
转录
,这将通过云翻译api。 这是不是最理想的方式?或者还有其他可能的选择吗?
浏览 2
提问于2020-04-14
得票数 0
1
回答
亚马逊
转录
流媒体服务
语音
转文本.NET
软件
开发工具包
、
、
、
、
我在亚马逊.NET
软件
开发工具包中找不到任何
转录
流媒体服务(从
语音
到文本)的参考资料。 在.NET SDK亚马逊
转录
流媒体服务中可以使用吗?任何参考资料都会有帮助。
浏览 53
提问于2019-01-22
得票数 4
1
回答
蔚蓝语翻译:如何激活识别只有当
语音
被检测到?
、
、
、
、
我目前正在开发一个实时翻译网络应用程序,允许多个参与者使用,并以多种语言分享他们的
转录
。提前感谢!
浏览 5
提问于2021-02-08
得票数 1
1
回答
对
文字
引擎的演讲:你有什么经验?
、
我刚刚试用了IBM Watson的演示,用于自动
语音
到文本的
转录
。我试着用火狐浏览器实时
转录
我的声音。大多数情况下,抄写是错误的或缺失的词。我还读到了泰德的演讲是如何
转录
的,我了解到他们是通过志愿者手工完成的。我想听听那些有演讲和
文字
引擎经验的人关于他们当前技术现状的经验。它似乎不够好的
转录
文本的动态,也不够好的
转录
文本,而没有认真的手动干预。 链接到演讲到文本演示
浏览 2
提问于2015-11-12
得票数 0
回答已采纳
1
回答
如何收集和准备用于
语音
识别的数据?
、
据我所知,大多数
语音
识别实现都依赖于二进制文件,这些文件包含他们试图“识别”的语言的声学模型。一个人可以手动抄写大量的演讲,但这需要大量的时间。即便如此,当给出一个包含某些
语音
的音频文件,并在文本文件中对其进行完整的
转录
时,单个单词的发音仍然需要以某种方式分开。要匹配音频的哪一部分对应于文本,仍然需要
语音
识别。 这是怎么收集起来的?如果一个人交出了价值数千小时的音频文件及其全部
转录
(不考虑人工
转录
的问题),那么如何在一个单词结束和另一个单词开始的正确间
浏览 6
提问于2015-08-03
得票数 2
回答已采纳
2
回答
Google
语音
识别库或API
、
、
、
谷歌最近在
语音
识别
软件
方面取得了很大进展,该
软件
被用于几个开源产品,例如Chromium 和Android免提短信。我想使用他们的
语音
识别作为我的服务器堆栈的一部分,但我找不到太多关于它的信息。文本识别
软件
是否以库或
软件
包的形式提供?或者,我可以从另一个程序调用chromium,将一些音频文件
转录
成文本吗?
浏览 3
提问于2013-03-23
得票数 3
2
回答
多语言youtube字幕支持
、
、
我很想找到youtube视频字幕/字幕的替代品。我希望任何人都可以开放访问,为我网站上发布的视频添加母语字幕。
浏览 0
提问于2009-09-27
得票数 1
回答已采纳
2
回答
Windows
语音
识别
软件
,以音频文件为输入,输出文本文件
、
、
我对用于Windows的
语音
识别
软件
感兴趣,它以一种标准格式(MP3、WAV、OGG等)获取播客的音频文件,并将
语音
的
转录
作为文本文件输出。其动机是帮助为官方wiki录制播客。我希望它能够教它,提高
语音
识别,或学习新单词。此外,它应该能够处理多人交谈,偶尔重叠的讲话,偶尔的音乐,或非说话的声音。 我只需要这个
软件
来处理英语。
浏览 0
提问于2014-04-14
得票数 5
1
回答
“捐赠这个
语音
邮件”和“允许自动谷歌系统分析你的
语音
邮件”是不是多余的?
如果我“允许自动谷歌系统分析您的
语音
邮件信息,以帮助提高
转录
质量”:在编辑成绩单时,是否建议检查“捐赠此
语音
信箱”选项?📷 我感到惊讶的是,当“允许自动谷歌系统分析
语音
邮件信息以帮助提高
转录
质量”时,默认情况下不会检查该选项,这让我怀疑这两种选项之间是否有任何区别。
浏览 0
提问于2014-08-12
得票数 2
回答已采纳
1
回答
如何在Azure中进行
语音
识别并立即完成
、
、
、
但是,我需要等待很长时间才能完成识别,例如1小时的
语音
文件。 有没有可能让Azure立即完成识别?目前,识别率约为1:1,即识别1小时的文件需要1小时。我希望这件事能在1:60完成。
浏览 126
提问于2021-11-04
得票数 1
1
回答
Google
语音
到文本的延迟
、
、
这是一个问题,我遇到了使用谷歌
语音
文字
引擎。我目前正在以32 in块实时播放16位/ 16 kHz音频。但是在发送音频和接收记录之间平均有25秒的延迟,这违背了实时
转录
的目的。
浏览 3
提问于2018-07-26
得票数 3
回答已采纳
2
回答
语音
到文本的大型音频文件(Microsoft
语音
API)
、
、
、
、
使用Microsoft
语音
API
转录
中/大型音频文件的最佳方法是什么,每个文件6~10分钟?比如批处理音频文件的
转录
?顺便说一句,我认为Bing
语音
API和新的
语音
服务API没有什么区别,对吗? 谢谢大家!
浏览 1
提问于2018-06-11
得票数 4
回答已采纳
1
回答
我收到了不止一份Speech to text IBM云服务的最终文本
、
、
我正在Angular的一个项目中使用Speech to text服务,我正在将来自麦克风的
语音
转换为文本,当我收到
转录
时,该服务有时会返回不止一个最终的
转录
。backgroundAudioSuppressio: 0.5, }, ); 在文档中,它提到interimResults是
文字
记录数量有限的地方,但通过将其放在错误的位置,我没有收到任何
文字
记录
浏览 16
提问于2020-04-18
得票数 0
1
回答
Microsoft
语音
识别默认值与API
、
、
、
因此,我一直在Windows10中使用微软
语音
识别,做训练练习,将文本口述到写字板中并进行更正,向字典中添加单词等等。我想用这个
软件
来
转录
.wav文件。似乎可以使用Windows
语音
识别API来做到这一点,但这似乎涉及到创建和加载自己的语法文件,这向我表明,这基本上将创建一个新的
语音
识别器,它使用相同的构建块,但与我在开始菜单中单击“开始
语音
识别”时运行的程序不同如果不是,是否还有一种方法可以检索默认
语音
识别器使用的所有数据,以便我可以准确地再现它的行为?如果我需要创建
浏览 5
提问于2016-03-18
得票数 1
2
回答
说话人无关
语音
命令识别
、
我正在寻找一个
软件
,一个库或一个算法,可以训练,以识别大约十几个说话人独立的声音命令。如果有帮助,可以只为特定的短语编写代码,在最坏的情况下,可以将短语减少到3或4。
浏览 0
提问于2014-10-01
得票数 6
1
回答
使用Watson对文本进行连续
语音
处理
、
、
、
我以前一直在使用IBM
语音
文本服务来
转录
已预先录制的完整音频文件。然而,我现在尝试在使用说话人识别功能的同时进行实时
转录
。
浏览 2
提问于2018-02-28
得票数 1
1
回答
YouTube的自动字幕比产生了更好的效果(模型:视频,UseEnhanced: true)。这怎么可能?
、
、
、
、
这里我的谷歌
语音
设置给AI发短信以下是
语音
到文本AI:的输出文件这是视频链接:Google to Text的SRT (由YouTube分配的时间):例如 Google
文字
演讲: Represent the
浏览 5
提问于2020-10-12
得票数 4
1
回答
电话录音自动
转录
软件
、
、
、
、
请推荐录制电话录音的
软件
。
软件
需要自动完成
转录
,而不是依靠人来完成
转录
。所有电话都是用英语打的。单个人是每个呼叫中的一方,如果需要,该人可以提供
语音
培训样本。对方在每一次通话中都会有不同的情况,因此无法获得
语音
培训样本。
浏览 0
提问于2020-07-23
得票数 1
1
回答
如何对iOS上的音频输入进行实时音节计数?
、
、
、
、
应该注意的是,说话者不会使用他们的母语,因此大多数现有的
语音
识别解决方案都无法工作。我看了一下CoreML,我也许可以用编码的音节数访问
语音
语料库,但我不确定我将如何开始训练这个模型。
浏览 6
提问于2022-11-11
得票数 0
1
回答
命令行
转录
工具
、
、
基本上,我用dragon监控一个文件夹,将wav文件放在那里,然后在另一个文件夹中等待
转录
输出。由于龙的崩溃,这样的解决方案最近给了相当多的头疼。我希望有一个简单的可执行文件按需执行
转录
(从而消除对永久运行的
软件
的需求),类似于:该
软件
应该有意大利语词典和声学模型可用,或至少应该是容易培训,以支持意大利语没有办公套件,所以windows
语音
引擎不是一个选择。 任何lib/dll以及它在vbscript或python
浏览 0
提问于2013-01-17
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券