语音识别数据集 - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

数据集中Wav音频文件的下采样

audio、dataset、speech-recognition、huggingface-transformers、huggingface-datasets

我已经从拥抱面部的LJ语音数据集进行自动语音识别训练。链接到数据集：音频的采样率是22050赫兹。我想把它转换成整个数据集的16000赫兹。输出

浏览 6提问于2022-02-14得票数 1

1回答

如何创建语音命令数据集

dataset、audio-recognition、data-augmentation

我正计划创建一个语音识别网络，它能识别少量的单词(语音命令)，并从谷歌( google )那里看到语音命令数据集。除了可用的数据集外，我还计划增加几个词，如“移动”、“保存”等，这些词不是谷歌数据集的一部分。是否有任何方法或其他来源可以为这些单词创建/查找数据集？由于许多在线数据集都可用于句子和语音

浏览 0提问于2018-07-25得票数 3

回答已采纳

1回答

我找不到一种方法将我的wav文件用作PyTorch中的数据集

python、pytorch、dataset、custom-dataset

你好，我是PyTorch的新手，我想做一个简单的语音识别，但我不想使用pytorch.datasets，我有一些声音数据集，但我找不到任何地方可以帮助我。我使用SPEECHCOMMANDS数据集，但我想使用自己的感谢您的阅读。

浏览 14提问于2021-04-09得票数 2

回答已采纳

1回答

Microsoft Azure的语音文本识别服务支持的自定义语法？

speech-to-text、microsoft-cognitive、azure-cognitive-services、azure-speech

我有以下两个问题：我们可以在微软的云语音识别服务中使用编译(二进制格式)语法吗？

浏览 2提问于2021-09-06得票数 0

2回答

System.Speech.Recognition；背景控制或语音识别

c#、speech-recognition、voice-recognition、microsoft-cognitive、system.speech.recognition

我想知道是否有可能不仅可以识别语音，还可以识别声音，以某种方式识别不同声音之间的差异从每个单独的声音，例如从两个同时或单独说话的用户作为不同的两个用户，获得接近于读取多个内容的内容。

浏览 8提问于2017-05-16得票数 0

3回答

如何在Unity3D上集成语音识别？

unity3d、speech-recognition

我正在做一些研究，我找不到任何的例子，团结集成语音识别作为输入层。有人知道这方面的例子吗？

浏览 7提问于2015-10-18得票数 0

回答已采纳

2回答

用于搜索集成的开源语音识别软件

search-engine、speech-recognition

我有一个搜索应用程序，像谷歌搜索，我需要集成到语音搜索设施，如谷歌语音搜索。我正在寻找一个开源的可扩展搜索引擎，我可以使用同样的。我遇到了Sphinx4语音识别引擎，并决定使用同样的。

浏览 3提问于2013-11-15得票数 0

回答已采纳

2回答

从音频识别数字

neural-network、audio-recognition

我对这个问题很感兴趣，有没有关于从音频中识别数字的研究？例如，有电话记录，你需要知道电话号码。

浏览 0提问于2019-09-27得票数 1

回答已采纳

1回答

低数据集上的ASR

machine-learning、deep-learning、preprocessing、speech-to-text

我正在做一个ASR(自动语音识别)作为硕士论文的低键数据集。语音和文本数据都有标签。大约有4000个短语和大约5个小时的演讲。我没有语音或信号处理的背景。预处理任务会有多大？

浏览 0提问于2019-12-27得票数 3

2回答

信号特征识别

python、audio、machine-learning、signal-processing

我正在尝试使用已知语音的训练数据库来识别语音中的音素。我的兴趣是第一！对机器学习或回归方法/算法有什么建议吗？

浏览 1提问于2014-09-17得票数 0

1回答

android语音识别支持哪些语言

android、speech-recognition

我想使用语音识别实现搜索，但没有看到有关语音识别支持的语言的信息。

浏览 2提问于2012-04-11得票数 0

回答已采纳

1回答

是否可以在我的应用程序中使用语音识别模块？

windows-phone-7、voice-recognition

我昨天在@Matthieu的博客上看到了一张图片(对不起，我现在找不到了。这张图片在麦克风图标内有一个文本框，就像手机中的搜索页面一样。谢谢。

浏览 3提问于2011-02-11得票数 2

回答已采纳

1回答

如何在通用语音数据集上训练CNN

python、keras、conv-neural-network、speech-recognition、librosa

我正在尝试用数据集训练cnn。我是新的语音识别，无法找到任何链接，如何使用数据集与角化。我遵循这个来构建一个简单的单词分类网络。但是我想用普通的声音数据集来放大它。任何帮助都是非常感谢的。谢谢

浏览 2提问于2019-08-01得票数 3

回答已采纳

2回答

离线语音识别可以提供个识别本地语音数据的demo吗？本地语音数据的如何填充到boby中呢？

语音识别

离线语音识别可以提供个识别本地语音数据的demo吗？本地语音数据的如何填充到boby中呢？

浏览 649提问于2018-04-28

1回答

录音识别sdk的录音文件如何保存？

语音识别、ide

实时语音识别sdk 的录音文件如何保存？停止识别后如何继续任务，而不是重新开始。

浏览 696提问于2019-07-16

1回答

将新的说话人添加到预先训练的说话人识别模型中

deep-learning、neural-network、voice-recognition、gmm

我已经训练了一个用于说话人识别的深度神经网络(对64个不同的说话人进行训练)，.Next，我想从模型中添加或删除一个说话人。谁能帮我解决编码部分如何做到这一点，因为我是新的语音识别。附注：如果我在预先训练的模型上使用一个新的数据集，那么我需要在新的64位演讲者上再次训练该模型。考虑到我只是想增加或删除1或2发言者，这是如何实现的？

浏览 8提问于2021-12-16得票数 0

1回答

[0,1]中学习/测试数据集的规范化

machine-learning、python、normalization

假设您将数据分成两组:培训集和测试集。您知道数据的输入在更低_边界，上界_界中。现在，假设您希望对[0, 1]之间的输入执行最小-最大规格化。对于最大值和最小值，是使用学习数据集的min/max还是使用界限更低_边界，上界_界？同样，为了规范测试集，您应该使用与学习数据集相同的界限。如果使用培训集的min/max，则可以在[0, 1]之外找到测试集中的一些值，例如，如果测试集的

浏览 0提问于2021-09-08得票数 1

回答已采纳

1回答