腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
非英文窗口系统上语音
识别
、
、
、
我无法在我的荷兰语windows系统上使用语音
识别
应用程序,因为它只在英文版本上可用。这个是可能的吗?有这样的库吗?
浏览 1
提问于2013-11-05
得票数 2
1
回答
谷歌语音
识别
是如何工作的?
我知道
音频
指纹
识别
音频
文件,这是很棒的,但我真正想知道的是Google是如何制作语音
识别
API的,它们是如何获取
音频
和返回的单词的。我写了一个宝石来指纹wav
音频
文件并对它们进行比较,但是如果我用指纹将我的声音与充满指纹的数据库进行比较,可能要花费很长时间。谷歌是怎么做到的?用途: 我真的很喜欢语音
识别
,我想要一个地方开始编码,但我不知道从哪里开始。DragonVoice是语音
识别
软件
的另一个例子,所有这些
软件
都非常
浏览 5
提问于2014-02-27
得票数 0
回答已采纳
1
回答
在
音频
文件中查找
音频
剪辑
、
我经常从大的
音频
文件中剪辑
音频
片段,这些文件通常有30到60分钟长。有数百个,可能是数千个这些
音频
文件。通常情况下,一切都很好,但有时我想回去重新听听我摘录的内容背后的一些背景。最近,我在摘录中加入了文件名以供参考,但我想知道是否有任何方法可以搜索
音频
文件。从字面上讲,这不是大多数关于这个话题的结果所提出的“语音
识别
搜索”。我有实际的,准确的原始
音频
,如果我可以让脚本扫描文件夹中的所有
音频
文件,看看剪裁后的
音频
文件是否出现在其中任何一个文件中,那就太棒
浏览 0
提问于2020-12-14
得票数 2
5
回答
MP3/WAV到文本(语音
识别
)
、
我正在寻找一个
软件
( Windows或Linux),可以将MP3/WAV文件转换为文本。 可以通过语音
识别
自动生成文本的内容,如YouTube上的自动字幕,但可以将这些字幕输出到文本文件中。
浏览 0
提问于2015-06-28
得票数 13
2
回答
创建自定义语音命令(GNU/Linux)
、
、
、
、
我正在尝试创建一个用于创建自定义语音命令的
软件
。目标是允许用户/我录制一些
音频
数据(2/3秒),用于定义命令/宏。然后,当用户要说话(录制相同的
音频
数据)时,将执行命令/宏。该
软件
必须能够在低成本计算机(例如RaspberryPi)中在不到1秒的处理时间内检测到命令。我已经通过两种方式进行了搜索:- Speech Recognition (CMU-Sphinx,Julius,simon):有很好的开源解决方案,但它们通常需要大型数据库文件,而语音
识别
并不是我真正想要
浏览 3
提问于2013-03-09
得票数 2
回答已采纳
2
回答
Google语音
识别
库或API
、
、
、
谷歌最近在语音
识别
软件
方面取得了很大进展,该
软件
被用于几个开源产品,例如Chromium 和Android免提短信。我想使用他们的语音
识别
作为我的服务器堆栈的一部分,但我找不到太多关于它的信息。文本
识别
软件
是否以库或
软件
包的形式提供?或者,我可以从另一个程序调用chromium,将一些
音频
文件转录成文本吗?
浏览 3
提问于2013-03-23
得票数 3
1
回答
提取
音频
文件的二进制表示
、
、
、
我想从一个
音频
文件(可能记录在audacity中)中提取出确切的二进制实现。我想要这个提取这些表示,以
识别
语音和声音,即一个基本的语音
识别
软件
。编辑-我想获得
音频
的波形,而不是图形,而是二进制表示,这样我就可以将语音转换为文本。
浏览 2
提问于2012-03-05
得票数 0
2
回答
语音到文本
识别
、
、
、
有没有可能编写一个语音到文本的
软件
,可以访问基于Googles网络的后端语音到文本系统?
浏览 0
提问于2011-08-16
得票数 4
回答已采纳
1
回答
来自雷达的
音频
信号比较
、
我们有一台雷达,可以通过耳机进行
音频
检测,以指示目标的类型。目标类型是(例如汽车/卡车/人)。雷达根据多普勒变化来区分这些目标,并将其向下转换为可听范围,操作员可以通过耳机听到。系统已经提供了与每种类型的目标(人/车/卡车)相对应的样本
音频
文件,以训练操作员知道当实况信号被馈送时他听到的是什么,并相应地确定它是什么目标。 我打算让一个
软件
来做这个操作员的工作。我想比较从雷达现场
音频
信号输入与7个不同的测试
音频
文件,并希望
软件
告诉我哪个文件匹配输入。
浏览 0
提问于2015-01-04
得票数 0
1
回答
什么是好的语音
识别
软件
?
我正在运行Lubuntu15.04,我正在寻找一个语音
识别
软件
,允许我打开和运行我的声音文件。在那里我可以定制,如果我说,因为我想要一个骑士凯特汽车的语音
识别
,我想要能够与汽车交谈。当我说“嘿Kitt”时,它会打开一个
音频
文件并播放我选择的
音频
文件。有什么建议吗?
浏览 0
提问于2015-06-25
得票数 0
1
回答
要将
音频
word保存为文本文件
、
我搜索并发现可以将
音频
单词从录制的
音频
文件保存到文本文件中。我还发现很少有
软件
可以做到这一点。但是没有得到任何适用于将
识别
出的
音频
单词从现场
音频
保存到文本文件的算法或解决方案。
浏览 3
提问于2015-09-12
得票数 0
2
回答
是否有任何方法来改变来电者的声音,使声音
识别
不可能?
、
、
我搜索并找到了这篇文章:然而,它并没有回答我的问题。 是否有任何方法改变一个人的声音,足以使手机呼叫无法
识别
的语音
识别
技术?
浏览 0
提问于2019-08-29
得票数 2
1
回答
如何收集和准备用于语音
识别
的数据?
、
据我所知,大多数语音
识别
实现都依赖于二进制文件,这些文件包含他们试图“
识别
”的语言的声学模型。一个人可以手动抄写大量的演讲,但这需要大量的时间。即便如此,当给出一个包含某些语音的
音频
文件,并在文本文件中对其进行完整的转录时,单个单词的发音仍然需要以某种方式分开。要匹配
音频
的哪一部分对应于文本,仍然需要语音
识别
。 这是怎么收集起来的?如果一个人交出了价值数千小时的
音频
文件及其全部转录(不考虑人工转录的问题),那么如何在一个单词结束和另一个单词开始的正确间
浏览 6
提问于2015-08-03
得票数 2
回答已采纳
1
回答
卡尔迪性别鉴定
我正在寻找一个
软件
/库,可以
识别
说话者的性别。如果一个人有一个
音频
文件,我想让
软件
检测出什么性别说过话,说了多长时间。你知道Kaldi 是否可行吗?
浏览 34
提问于2016-11-07
得票数 0
1
回答
启动Ubuntu时没有声音
、
、
为了让我有
音频
,我必须拔掉设备的插头,然后再插入。这是在一次更新之后开始发生的,这也破坏了我的图形(我现在已经修复了)。sudo apt install pulseaudioReading package lists...
浏览 0
提问于2021-12-02
得票数 1
回答已采纳
2
回答
我能把一个文件从一个节点-webkit应用程序中拖出并放到桌面上吗?
、
、
、
客户端试图弄清楚他们是否愿意使用带有AngularJS的节点-webkit应用程序,但他们的一个关键在于,他们希望用户能够将文件从应用程序中拖出桌面或电子邮件客户端(如Outlook或Lotusnotes),就像您可以使用applet一样(我非常想避免这种情况)。编辑:我也从未使用过node.js
浏览 1
提问于2013-06-27
得票数 1
回答已采纳
1
回答
创建自定义声音
识别
软件
切换
音频
的建议
、
我需要开发一个程序,以切换一个特定的
音频
轨道上或关闭,当它
识别
鹦鹉,尖叫或尖叫。该
软件
将需要
识别
特定范围的声音,并允许范围内的一些变化(因为鹦鹉很可能不会复制它的山毛榉每一次准确)。例子:鸟尖叫,没有
音频
。鸟停止尖叫5秒,音轨赞扬鸟播放。经常的喋喋不休需要被完全忽略,因为它是不应该被劝阻的。我听说过java库有内置字典的语音
识别
,但是
软件
需要学习我的鹦鹉发出的特定声音,而不是单词或任何随机的鸟声。编辑:(也许这是一个更简单的解决方案),有没有一种基于输入量的
音频
浏览 0
提问于2011-03-08
得票数 0
3
回答
如何将music21中的输出保存为MIDI文件?
、
、
、
如何使用music21模块保存Python中的
音频
输出?我已经阅读了整个用户的guide(http://music21.readthedocs.org/en/latest/usersGuide/index.html](])的上述模块,但我找不到任何信息,保存作为一个
音频
文件,可以被windows
识别
没有任何额外的
软件
(例如MIDI)。
浏览 4
提问于2015-12-20
得票数 9
回答已采纳
2
回答
音频
文件的数字签名
、
、
、
、
我想知道在座的任何人是否知道如何为上传到soundcloud等音乐社区网站的
音频
文件分配数字签名或唯一ID?我在大学里把它作为一个项目来做,目前还没有找到任何有用的信息。
浏览 15
提问于2014-02-17
得票数 2
1
回答
用于记录已完成会议的语音
识别
软件
、
我正在寻找语音
识别
软件
,我可以有分析某些
音频
(S)文件(与用户(S)的声音在其中),标记的声音为用户(本人) x。这样做的目的是,在开会时,
软件
识别
数据库中的声音,将这些声音标记为用户X、Y和Z,他们所说的一切都将被标记为"Y:那似乎是个好主意。“ "Z:
识别
我们的声音并将单词标记为X/Y/Z的人“。
浏览 0
提问于2016-09-13
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
怎么将音频转换成文字?可以识别音频为文字的软件有哪些
录音转文字免费的软件哪个好用?推荐这些识别音频文字的软件
提取音频软件分享!提取音频软件大合集!
音频翻译软件有哪些?这些音频翻译软件值得收藏
音频软件哪个好?这有3个音频配音软件分享
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券