音频识别软件 - 腾讯云开发者社区

、、、

我无法在我的荷兰语windows系统上使用语音识别应用程序，因为它只在英文版本上可用。这个是可能的吗？有这样的库吗？

浏览 1提问于2013-11-05得票数 2

1回答

谷歌语音识别是如何工作的？

我知道音频指纹识别音频文件，这是很棒的，但我真正想知道的是Google是如何制作语音识别API的，它们是如何获取音频和返回的单词的。我写了一个宝石来指纹wav音频文件并对它们进行比较，但是如果我用指纹将我的声音与充满指纹的数据库进行比较，可能要花费很长时间。谷歌是怎么做到的？用途：我真的很喜欢语音识别，我想要一个地方开始编码，但我不知道从哪里开始。DragonVoice是语音识别软件的另一个例子，所有这些软件都非常

浏览 5提问于2014-02-27得票数 0

回答已采纳

1回答

在音频文件中查找音频剪辑

、

我经常从大的音频文件中剪辑音频片段，这些文件通常有30到60分钟长。有数百个，可能是数千个这些音频文件。通常情况下，一切都很好，但有时我想回去重新听听我摘录的内容背后的一些背景。最近，我在摘录中加入了文件名以供参考，但我想知道是否有任何方法可以搜索音频文件。从字面上讲，这不是大多数关于这个话题的结果所提出的“语音识别搜索”。我有实际的，准确的原始音频，如果我可以让脚本扫描文件夹中的所有音频文件，看看剪裁后的音频文件是否出现在其中任何一个文件中，那就太棒

浏览 0提问于2020-12-14得票数 2

5回答

MP3/WAV到文本(语音识别)

、

我正在寻找一个软件( Windows或Linux)，可以将MP3/WAV文件转换为文本。可以通过语音识别自动生成文本的内容，如YouTube上的自动字幕，但可以将这些字幕输出到文本文件中。

浏览 0提问于2015-06-28得票数 13

2回答

创建自定义语音命令(GNU/Linux)

、、、、

我正在尝试创建一个用于创建自定义语音命令的软件。目标是允许用户/我录制一些音频数据(2/3秒)，用于定义命令/宏。然后，当用户要说话(录制相同的音频数据)时，将执行命令/宏。该软件必须能够在低成本计算机(例如RaspberryPi)中在不到1秒的处理时间内检测到命令。我已经通过两种方式进行了搜索：- Speech Recognition (CMU-Sphinx，Julius，simon)：有很好的开源解决方案，但它们通常需要大型数据库文件，而语音识别并不是我真正想要

浏览 3提问于2013-03-09得票数 2

回答已采纳

2回答

Google语音识别库或API

、、、

谷歌最近在语音识别软件方面取得了很大进展，该软件被用于几个开源产品，例如Chromium 和Android免提短信。我想使用他们的语音识别作为我的服务器堆栈的一部分，但我找不到太多关于它的信息。文本识别软件是否以库或软件包的形式提供？或者，我可以从另一个程序调用chromium，将一些音频文件转录成文本吗？

浏览 3提问于2013-03-23得票数 3

1回答

提取音频文件的二进制表示

、、、

我想从一个音频文件(可能记录在audacity中)中提取出确切的二进制实现。我想要这个提取这些表示，以识别语音和声音，即一个基本的语音识别软件。编辑-我想获得音频的波形，而不是图形，而是二进制表示，这样我就可以将语音转换为文本。

浏览 2提问于2012-03-05得票数 0

2回答

语音到文本识别

、、、

有没有可能编写一个语音到文本的软件，可以访问基于Googles网络的后端语音到文本系统？

浏览 0提问于2011-08-16得票数 4

回答已采纳

1回答

来自雷达的音频信号比较

、

我们有一台雷达，可以通过耳机进行音频检测，以指示目标的类型。目标类型是(例如汽车/卡车/人)。雷达根据多普勒变化来区分这些目标，并将其向下转换为可听范围，操作员可以通过耳机听到。系统已经提供了与每种类型的目标(人/车/卡车)相对应的样本音频文件，以训练操作员知道当实况信号被馈送时他听到的是什么，并相应地确定它是什么目标。我打算让一个软件来做这个操作员的工作。我想比较从雷达现场音频信号输入与7个不同的测试音频文件，并希望软件告诉我哪个文件匹配输入。

浏览 0提问于2015-01-04得票数 0

1回答

什么是好的语音识别软件？

我正在运行Lubuntu15.04，我正在寻找一个语音识别软件，允许我打开和运行我的声音文件。在那里我可以定制，如果我说，因为我想要一个骑士凯特汽车的语音识别，我想要能够与汽车交谈。当我说“嘿Kitt”时，它会打开一个音频文件并播放我选择的音频文件。有什么建议吗？

浏览 0提问于2015-06-25得票数 0

1回答

要将音频word保存为文本文件

、

我搜索并发现可以将音频单词从录制的音频文件保存到文本文件中。我还发现很少有软件可以做到这一点。但是没有得到任何适用于将识别出的音频单词从现场音频保存到文本文件的算法或解决方案。

浏览 3提问于2015-09-12得票数 0

2回答

是否有任何方法来改变来电者的声音，使声音识别不可能？

、、

我搜索并找到了这篇文章：然而，它并没有回答我的问题。是否有任何方法改变一个人的声音，足以使手机呼叫无法识别的语音识别技术？

浏览 0提问于2019-08-29得票数 2

1回答

如何收集和准备用于语音识别的数据？

、

据我所知，大多数语音识别实现都依赖于二进制文件，这些文件包含他们试图“识别”的语言的声学模型。一个人可以手动抄写大量的演讲，但这需要大量的时间。即便如此，当给出一个包含某些语音的音频文件，并在文本文件中对其进行完整的转录时，单个单词的发音仍然需要以某种方式分开。要匹配音频的哪一部分对应于文本，仍然需要语音识别。这是怎么收集起来的？如果一个人交出了价值数千小时的音频文件及其全部转录(不考虑人工转录的问题)，那么如何在一个单词结束和另一个单词开始的正确间

浏览 6提问于2015-08-03得票数 2

回答已采纳

1回答

卡尔迪性别鉴定

我正在寻找一个软件/库，可以识别说话者的性别。如果一个人有一个音频文件，我想让软件检测出什么性别说过话，说了多长时间。你知道Kaldi 是否可行吗？

浏览 34提问于2016-11-07得票数 0

1回答

启动Ubuntu时没有声音

、、

为了让我有音频，我必须拔掉设备的插头，然后再插入。这是在一次更新之后开始发生的，这也破坏了我的图形(我现在已经修复了)。sudo apt install pulseaudioReading package lists...

浏览 0提问于2021-12-02得票数 1

回答已采纳

2回答

我能把一个文件从一个节点-webkit应用程序中拖出并放到桌面上吗？

、、、

客户端试图弄清楚他们是否愿意使用带有AngularJS的节点-webkit应用程序，但他们的一个关键在于，他们希望用户能够将文件从应用程序中拖出桌面或电子邮件客户端(如Outlook或Lotusnotes)，就像您可以使用applet一样(我非常想避免这种情况)。编辑：我也从未使用过node.js

浏览 1提问于2013-06-27得票数 1

回答已采纳

1回答

创建自定义声音识别软件切换音频的建议

、

我需要开发一个程序，以切换一个特定的音频轨道上或关闭，当它识别鹦鹉，尖叫或尖叫。该软件将需要识别特定范围的声音，并允许范围内的一些变化(因为鹦鹉很可能不会复制它的山毛榉每一次准确)。例子：鸟尖叫，没有音频。鸟停止尖叫5秒，音轨赞扬鸟播放。经常的喋喋不休需要被完全忽略，因为它是不应该被劝阻的。我听说过java库有内置字典的语音识别，但是软件需要学习我的鹦鹉发出的特定声音，而不是单词或任何随机的鸟声。编辑：(也许这是一个更简单的解决方案)，有没有一种基于输入量的音频

浏览 0提问于2011-03-08得票数 0

3回答

如何将music21中的输出保存为MIDI文件？

、、、

如何使用music21模块保存Python中的音频输出？我已经阅读了整个用户的guide(http://music21.readthedocs.org/en/latest/usersGuide/index.html](])的上述模块，但我找不到任何信息，保存作为一个音频文件，可以被windows识别没有任何额外的软件(例如MIDI)。

浏览 4提问于2015-12-20得票数 9

回答已采纳

2回答

音频文件的数字签名

、、、、

我想知道在座的任何人是否知道如何为上传到soundcloud等音乐社区网站的音频文件分配数字签名或唯一ID？我在大学里把它作为一个项目来做，目前还没有找到任何有用的信息。

浏览 15提问于2014-02-17得票数 2

1回答

用于记录已完成会议的语音识别软件

、

我正在寻找语音识别软件，我可以有分析某些音频(S)文件(与用户(S)的声音在其中)，标记的声音为用户(本人) x。这样做的目的是，在开会时，软件识别数据库中的声音，将这些声音标记为用户X、Y和Z，他们所说的一切都将被标记为"Y:那似乎是个好主意。“ "Z:识别我们的声音并将单词标记为X/Y/Z的人“。

浏览 0提问于2016-09-13得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

非英文窗口系统上语音识别

谷歌语音识别是如何工作的？

在音频文件中查找音频剪辑

MP3/WAV到文本(语音识别)

创建自定义语音命令(GNU/Linux)

Google语音识别库或API

提取音频文件的二进制表示

语音到文本识别

来自雷达的音频信号比较

什么是好的语音识别软件？

要将音频word保存为文本文件

是否有任何方法来改变来电者的声音，使声音识别不可能？

如何收集和准备用于语音识别的数据？

卡尔迪性别鉴定

启动Ubuntu时没有声音

我能把一个文件从一个节点-webkit应用程序中拖出并放到桌面上吗？

创建自定义声音识别软件切换音频的建议

如何将music21中的输出保存为MIDI文件？

音频文件的数字签名

用于记录已完成会议的语音识别软件

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐