腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
数据
集中Wav音频文件的下采样
、
、
、
、
我已经从拥抱面部的LJ
语音
数据
集
进行自动
语音
识别
训练。链接到
数据
集
:音频的采样率是22050赫兹。我想把它转换成整个
数据
集
的16000赫兹。输出
浏览 6
提问于2022-02-14
得票数 1
1
回答
如何创建
语音
命令
数据
集
、
、
我正计划创建一个
语音
识别
网络,它能
识别
少量的单词(
语音
命令),并从谷歌( google )那里看到
语音
命令
数据
集
。除了可用的
数据
集
外,我还计划增加几个词,如“移动”、“保存”等,这些词不是谷歌
数据
集
的一部分。 是否有任何方法或其他来源可以为这些单词创建/查找
数据
集
?由于许多在线
数据
集
都可用于句子和
语音
浏览 0
提问于2018-07-25
得票数 3
回答已采纳
1
回答
我找不到一种方法将我的wav文件用作PyTorch中的
数据
集
、
、
、
你好,我是PyTorch的新手,我想做一个简单的
语音
识别
,但我不想使用pytorch.datasets,我有一些声音
数据
集
,但我找不到任何地方可以帮助我。我使用SPEECHCOMMANDS
数据
集
,但我想使用自己的 感谢您的阅读。
浏览 14
提问于2021-04-09
得票数 2
回答已采纳
1
回答
Microsoft Azure的
语音
文本
识别
服务支持的自定义语法?
、
、
、
我有以下两个问题: 我们可以在微软的云
语音
识别
服务中使用编译(二进制格式)语法吗?
浏览 2
提问于2021-09-06
得票数 0
2
回答
System.Speech.Recognition;背景控制或
语音
识别
、
、
、
、
我想知道是否有可能不仅可以
识别
语音
,还可以
识别
声音,以某种方式
识别
不同声音之间的差异 从每个单独的声音,例如从两个同时或单独说话的用户作为不同的两个用户,获得接近于读取多个内容的内容。
浏览 8
提问于2017-05-16
得票数 0
3
回答
如何在Unity3D上集成
语音
识别
?
、
我正在做一些研究,我找不到任何的例子,团结集成
语音
识别
作为输入层。 有人知道这方面的例子吗?
浏览 7
提问于2015-10-18
得票数 0
回答已采纳
2
回答
用于搜索集成的开源
语音
识别
软件
、
我有一个搜索应用程序,像谷歌搜索,我需要集成到
语音
搜索设施,如谷歌
语音
搜索。我正在寻找一个开源的可扩展搜索引擎,我可以使用同样的。我遇到了Sphinx4
语音
识别
引擎,并决定使用同样的。
浏览 3
提问于2013-11-15
得票数 0
回答已采纳
2
回答
从音频
识别
数字
、
我对这个问题很感兴趣,有没有关于从音频中
识别
数字的研究?例如,有电话记录,你需要知道电话号码。
浏览 0
提问于2019-09-27
得票数 1
回答已采纳
1
回答
低
数据
集
上的ASR
、
、
、
我正在做一个ASR(自动
语音
识别
)作为硕士论文的低键
数据
集
。
语音
和文本
数据
都有标签。大约有4000个短语和大约5个小时的演讲。 我没有
语音
或信号处理的背景。预处理任务会有多大?
浏览 0
提问于2019-12-27
得票数 3
2
回答
信号特征
识别
、
、
、
我正在尝试使用已知
语音
的训练
数据
库来
识别
语音
中的音素。 我的兴趣是第一!对机器学习或回归方法/算法有什么建议吗?
浏览 1
提问于2014-09-17
得票数 0
1
回答
android
语音
识别
支持哪些语言
、
我想使用
语音
识别
实现搜索,但没有看到有关
语音
识别
支持的语言的信息。
浏览 2
提问于2012-04-11
得票数 0
回答已采纳
1
回答
是否可以在我的应用程序中使用
语音
识别
模块?
、
我昨天在@Matthieu的博客上看到了一张图片(对不起,我现在找不到了。这张图片在麦克风图标内有一个文本框,就像手机中的搜索页面一样。 谢谢。
浏览 3
提问于2011-02-11
得票数 2
回答已采纳
1
回答
如何在通用
语音
数据
集
上训练CNN
、
、
、
、
我正在尝试用
数据
集训练cnn。我是新的
语音
识别
,无法找到任何链接,如何使用
数据
集
与角化。我遵循这个来构建一个简单的单词分类网络。但是我想用普通的声音
数据
集
来放大它。任何帮助都是非常感谢的。 谢谢
浏览 2
提问于2019-08-01
得票数 3
回答已采纳
2
回答
离线
语音
识别
可以提供个
识别
本地
语音
数据
的demo吗?本地
语音
数据
的如何填充到boby中呢?
离线
语音
识别
可以提供个
识别
本地
语音
数据
的demo吗?本地
语音
数据
的如何填充到boby中呢?
浏览 576
提问于2018-04-28
1
回答
录音
识别
sdk的录音文件如何保存?
、
实时
语音
识别
sdk 的录音文件如何保存?停止
识别
后如何继续任务,而不是重新开始。
浏览 578
提问于2019-07-16
1
回答
将新的说话人添加到预先训练的说话人
识别
模型中
、
、
、
我已经训练了一个用于说话人
识别
的深度神经网络(对64个不同的说话人进行训练),.Next,我想从模型中添加或删除一个说话人。谁能帮我解决编码部分如何做到这一点,因为我是新的
语音
识别
。附注:如果我在预先训练的模型上使用一个新的
数据
集
,那么我需要在新的64位演讲者上再次训练该模型。考虑到我只是想增加或删除1或2发言者,这是如何实现的?
浏览 8
提问于2021-12-16
得票数 0
1
回答
[0,1]中学习/测试
数据
集
的规范化
、
、
假设您将
数据
分成两组:培训
集
和测试
集
。您知道
数据
的输入在更低_边界,上界_界中。现在,假设您希望对[0, 1]之间的输入执行最小-最大规格化。对于最大值和最小值,是使用学习
数据
集
的min/max还是使用界限更低_边界,上界_界? 同样,为了规范测试
集
,您应该使用与学习
数据
集
相同的界限。如果使用培训
集
的min/max,则可以在[0, 1]之外找到测试集中的一些值,例如,如果测试
集
的
浏览 0
提问于2021-09-08
得票数 1
回答已采纳
1
回答
是否有用于语速的标记
数据
集
?使用诸如快速、中等、慢速或基于每分钟的字数的标签?
、
、
我正在做一个关于ML的项目,用于从音频文件中找到
语音
速率。我找不到它的标签
数据
集
。有什么建议吗?
浏览 0
提问于2020-02-17
得票数 1
2
回答
SFSpeechRecognizer需要互联网连接吗?
、
、
SFSpeechRecognizer是像Siri那样在苹果服务器上进行处理,还是在iPhone上本地完成?
浏览 9
提问于2016-06-20
得票数 3
回答已采纳
1
回答
COS+离线
识别
这个是只要我在对象存储管理上传文件,后台就会自动触发
识别
,并且把结果写到cos上吗?
、
请描述您的问题地址:https://cloud.tencent.com/document/product/441/6199
浏览 164
提问于2018-03-12
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
【公开数据集】WenetSpeech:10000小时的中文语音识别数据集
Mozilla开源语音识别模型和世界第二大语音数据集
【五号雷达-数据快讯】Bud500 - 越南自动语音识别数据集
语音数据采集提高语音合成和语音识别技术|数据堂
新手入门深度学习做语音识别?谷歌免费开源语言指令数据集!
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券