腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
实时语音
识别
音源问题?
、
、
、
使用官方提供的实时语音转
文字
demo,可以通过文件流的方式
识别
出
音频
文件的语音并转成
文字
。当
音频
流来源切换到前端调用麦克风实时发送数据,就无法
识别
出
文字
。request.setEngineModelType("16k_zh"); //模型类型为必传参数,否则异常 request.setVoiceFormat(1); //指定
音频
格式.newSpeechRecogniz
浏览 84
提问于2024-04-08
1
回答
同步文本和
音频
。有没有NLP/语音到文本库来做这件事?
、
、
我想要同步语音录音与已知的文本。是否有一个语音到文本/自然语言处理库可以促进这一点?我想我会想要检测单词边界并从字典中计算候选匹配。我发现的大部分问题都与书面语言有关。 我到目前为止发现的是:
浏览 1
提问于2010-11-01
得票数 14
回答已采纳
1
回答
Google语音
识别
时间戳
、
我有一个
音频
文件,而且我有那个
音频
文件的准确记录。我希望能够在这个特定的
文字
记录中得到每个单词的时间戳。有没有人知道谷歌语音
识别
是否有可能做到这一点?
浏览 3
提问于2020-04-25
得票数 1
1
回答
语音
识别
是否支持定位
识别
位置?
浏览 161
提问于2022-06-15
1
回答
如何创建类似voicebase的高亮显示/照明
可以复制在线最终文本,就像这样:,照亮每个单词或短语
浏览 1
提问于2016-05-25
得票数 0
1
回答
语音
识别
支持方言语音转普通话语音吗?
浏览 128
提问于2022-06-15
4
回答
腾讯语音
识别
和一句话
识别
,是一样的吗?
、
请描述您的问题 [附加信息]
浏览 830
提问于2018-05-29
1
回答
如何训练语音
识别
的lstm
、
、
、
、
我正在尝试训练用于语音
识别
的lstm模型,但不知道要使用什么训练数据和目标数据。我使用的是,它包含
音频
文件和它们的
文字
记录。在这一点上,我知道目标数据将被矢量化文本文本。至于训练数据,我在考虑使用每个
音频
文件(或MFCC特征)中的频率和时间。如果这是解决问题的正确方法,训练数据/
音频
将是多个数组,我如何将这些数组输入到我的lstm模型中?我需要对它们进行矢量化吗?
浏览 1
提问于2016-11-26
得票数 5
回答已采纳
2
回答
是否有任何方法来改变来电者的声音,使声音
识别
不可能?
、
、
我搜索并找到了这篇文章:然而,它并没有回答我的问题。 是否有任何方法改变一个人的声音,足以使手机呼叫无法
识别
的语音
识别
技术?
浏览 0
提问于2019-08-29
得票数 2
1
回答
如何使用完全用C\C++编程语言编写的库将pcm
音频
转换为文本?
、
、
如何使用完全用C\C++编程语言编写的库将pcm
音频
转换为文本?那我需要什么?
浏览 5
提问于2010-01-07
得票数 1
回答已采纳
1
回答
使用Youtube作为语音
识别
数据集
、
DNNs是一种巨大的数据需求算法,尤其是双向LSTM算法.对于语音
识别
模型,对于特定的语言/口音,缺少语音语料库。然而,YouTube也是一个巨大的库。我需要使用一些脚本/软件,它可以自动下载YouTube视频(可能只有
音频
)和相关的字幕,然后将其分割成20秒的片段,这样就可以用作训练语音语料库。 有没有任何方式可以下载来自Youtube的字幕?给出一个
音频
和脚本,我如何将一个
音频
分割成20秒的片段,并在
文字
记录中做同样的剪辑?
浏览 0
提问于2018-12-21
得票数 0
0
回答
如何在成绩单中突出显示填充词(嗯,嗯,啊)?
、
目前,谷歌云语音返回的
文字
记录似乎会自动过滤掉这样的词(嗯,嗯,啊,喜欢,等等)。 我尝试在我的
音频
识别
呼叫中使用' phrases‘参数,它侧重于检测
音频
中的特定短语。
浏览 9
提问于2017-11-28
得票数 6
1
回答
谷歌语音到文本是如何工作的?
、
、
、
我想知道,谷歌如何在他们的语音
识别
API中将语音转换为文本。它们是否存储了几乎所有的声音并在特定的频率水平上进行匹配,或者是否有不同的
音频
编解码算法来分析"A“、"B”、"V“、"D”、"Hello“等不同声音模式的声音。音乐有弹吉他,鼓和声音的声音,我想过滤他们在三个输出分别吉他声音,鼓音,声音分开,并进一步解码声音为
文字
。
浏览 3
提问于2016-06-12
得票数 3
回答已采纳
1
回答
google-语音API转录反应被重复多次
、
我正在使用最新的python库的google (0.35.0),我得到的结果如下,第一个转录结果的单词在第二个转录结果中被重复,等等直到结束。在先前的版本中,情况并非如此(0.34.0)源代码: encoding=enums.RecognitionConfig.AudioEncoding.FLAC, language_code='en-US',
浏览 0
提问于2018-07-25
得票数 0
1
回答
语音
识别
支持什么语言?
浏览 223
提问于2022-06-15
1
回答
为sphinx-4制作定制的.dict文件
、
、
我正在尝试使用Sphinx-4创建一个用于实时语音字母
识别
的Java应用程序。我只需要程序来
识别
一小部分单词(即英
文字
母表)。但是,它非常慢并且不准确(大约50倍
音频
时间)。我正在考虑制作我自己的自定义.dict文件,希望它运行得更快更准确。 我想问一下,这是否可行?如果是这样的话,我如何制作自己的定制词典?
浏览 2
提问于2015-12-25
得票数 0
1
回答
我能在谷歌玻璃语音
识别
中使用希伯来语吗?
、
、
、
我在这里读到,玻璃里有两种声音命令:2)言论自由
识别
(例如“纽约第五大道”) 我希望开发一个玻璃应用程序,并使用语音
识别
。
浏览 1
提问于2014-01-29
得票数 3
1
回答
Xamarin Uwp中的语音到文本转换
我需要实现在Xamarin Uwp平台特定的
音频
到文本转换器。我可以录制
音频
并保存该
音频
。但现在我需要将该
音频
文件转换为文本文件。如果有人能给我提供任何好的工作范例,那就对我来说真的很好。
浏览 14
提问于2017-07-17
得票数 0
7
回答
目前国内的语音
识别
技术达到了什么水准?还存在哪些问题?
现在技术越来越厉害了,前几年还感觉语音打字特别不靠谱,各种语音助手也相当蠢萌,想问下现在国内语音
识别
发展到什么水平了? 实时且准确的将语音转化成相对应的文本已经达到了什么样的水准?
浏览 2309
提问于2018-08-06
1
回答
在通过google assitant打开任何应用程序之前设置语音密码
、
我目前正在开发一个类似金库的应用程序,它可以阻止你打开该应用程序,但只能通过你在谷歌助手上的语音或指纹来打开。但我的问题是,可能是用指纹我可以,但是用语音怎么做到??因为我需要把声音存储在某个地方,然后再进行比较..请帮帮我
浏览 1
提问于2018-04-24
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
怎么将音频转换成文字?可以识别音频为文字的软件有哪些
语音识别转文字-几分钟告诉你音频转文字的方法
录音转文字免费的软件哪个好用?推荐这些识别音频文字的软件
音频怎么转文字?来学习音频转文字怎么操作
音频转文字怎么操作?今天教你怎样音频转文字
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券