腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如何创建类似voicebase的高亮显示/照明
可以复制在线最终文本,就像这样:,照亮每个单词或短语
浏览 1
提问于2016-05-25
得票数 0
2
回答
是否有任何方法来改变来电者的声音,使声音
识别
不可能?
、
、
我搜索并找到了这篇文章:然而,它并没有回答我的问题。 是否有任何方法改变一个人的声音,足以使手机呼叫无法
识别
的语音
识别
技术?
浏览 0
提问于2019-08-29
得票数 2
1
回答
使用Youtube作为语音
识别
数据集
、
DNNs是一种巨大的数据需求算法,尤其是双向LSTM算法.对于语音
识别
模型,对于特定的语言/口音,缺少语音语料库。然而,YouTube也是一个巨大的库。我需要使用一些脚本/
软件
,它可以自动下载YouTube视频(可能只有
音频
)和相关的字幕,然后将其分割成20秒的片段,这样就可以用作训练语音语料库。 有没有任何方式可以下载来自Youtube的字幕?给出一个
音频
和脚本,我如何将一个
音频
分割成20秒的片段,并在
文字
记录中做同样的剪辑?
浏览 0
提问于2018-12-21
得票数 0
1
回答
非英文窗口系统上语音
识别
、
、
、
我无法在我的荷兰语windows系统上使用语音
识别
应用程序,因为它只在英文版本上可用。这个是可能的吗?有这样的库吗?
浏览 1
提问于2013-11-05
得票数 2
1
回答
谷歌语音
识别
是如何工作的?
我知道
音频
指纹
识别
音频
文件,这是很棒的,但我真正想知道的是Google是如何制作语音
识别
API的,它们是如何获取
音频
和返回的单词的。我写了一个宝石来指纹wav
音频
文件并对它们进行比较,但是如果我用指纹将我的声音与充满指纹的数据库进行比较,可能要花费很长时间。谷歌是怎么做到的?用途: 我真的很喜欢语音
识别
,我想要一个地方开始编码,但我不知道从哪里开始。DragonVoice是语音
识别
软件
的另一个例子,所有这些
软件
都非常
浏览 5
提问于2014-02-27
得票数 0
回答已采纳
1
回答
实时语音
识别
音源问题?
、
、
、
使用官方提供的实时语音转
文字
demo,可以通过文件流的方式
识别
出
音频
文件的语音并转成
文字
。当
音频
流来源切换到前端调用麦克风实时发送数据,就无法
识别
出
文字
。request.setEngineModelType("16k_zh"); //模型类型为必传参数,否则异常 request.setVoiceFormat(1); //指定
音频
格式.newSpeechRecogniz
浏览 190
提问于2024-04-08
1
回答
同步文本和
音频
。有没有NLP/语音到文本库来做这件事?
、
、
我想要同步语音录音与已知的文本。是否有一个语音到文本/自然语言处理库可以促进这一点?我想我会想要检测单词边界并从字典中计算候选匹配。我发现的大部分问题都与书面语言有关。 我到目前为止发现的是:
浏览 1
提问于2010-11-01
得票数 14
回答已采纳
1
回答
在
音频
文件中查找
音频
剪辑
、
我经常从大的
音频
文件中剪辑
音频
片段,这些文件通常有30到60分钟长。有数百个,可能是数千个这些
音频
文件。通常情况下,一切都很好,但有时我想回去重新听听我摘录的内容背后的一些背景。最近,我在摘录中加入了文件名以供参考,但我想知道是否有任何方法可以搜索
音频
文件。从字面上讲,这不是大多数关于这个话题的结果所提出的“语音
识别
搜索”。我有实际的,准确的原始
音频
,如果我可以让脚本扫描文件夹中的所有
音频
文件,看看剪裁后的
音频
文件是否出现在其中任何一个文件中,那就太棒
浏览 0
提问于2020-12-14
得票数 2
4
回答
ORC
文字
识别
怎么使用下载?
点击进去简介和费用介绍,具体怎么使用操作?
浏览 574
提问于2018-04-10
5
回答
MP3/WAV到文本(语音
识别
)
、
我正在寻找一个
软件
( Windows或Linux),可以将MP3/WAV文件转换为文本。 可以通过语音
识别
自动生成文本的内容,如YouTube上的自动字幕,但可以将这些字幕输出到文本文件中。
浏览 0
提问于2015-06-28
得票数 13
1
回答
将
音频
文件合并到一个视频中,该视频在播放时显示原始文件名。
、
、
我有一个短
音频
mp3文件列表。是否有任何
软件
可以自动将它们合并成视频,在播放时显示原始
音频
文件的名称?我正在使用Ubuntu,我将在Ubuntu中使用这样的
软件
浏览 0
提问于2014-11-13
得票数 2
回答已采纳
2
回答
创建自定义语音命令(GNU/Linux)
、
、
、
、
我正在尝试创建一个用于创建自定义语音命令的
软件
。目标是允许用户/我录制一些
音频
数据(2/3秒),用于定义命令/宏。然后,当用户要说话(录制相同的
音频
数据)时,将执行命令/宏。该
软件
必须能够在低成本计算机(例如RaspberryPi)中在不到1秒的处理时间内检测到命令。我已经通过两种方式进行了搜索:- Speech Recognition (CMU-Sphinx,Julius,simon):有很好的开源解决方案,但它们通常需要大型数据库文件,而语音
识别
并不是我真正想要
浏览 3
提问于2013-03-09
得票数 2
回答已采纳
1
回答
Google语音
识别
时间戳
、
我有一个
音频
文件,而且我有那个
音频
文件的准确记录。我希望能够在这个特定的
文字
记录中得到每个单词的时间戳。有没有人知道谷歌语音
识别
是否有可能做到这一点?
浏览 3
提问于2020-04-25
得票数 1
1
回答
语音
识别
是否支持定位
识别
位置?
浏览 198
提问于2022-06-15
1
回答
语音
识别
支持方言语音转普通话语音吗?
浏览 169
提问于2022-06-15
2
回答
Google语音
识别
库或API
、
、
、
谷歌最近在语音
识别
软件
方面取得了很大进展,该
软件
被用于几个开源产品,例如Chromium 和Android免提短信。我想使用他们的语音
识别
作为我的服务器堆栈的一部分,但我找不到太多关于它的信息。文本
识别
软件
是否以库或
软件
包的形式提供?或者,我可以从另一个程序调用chromium,将一些
音频
文件转录成文本吗?
浏览 3
提问于2013-03-23
得票数 3
1
回答
提取
音频
文件的二进制表示
、
、
、
我想从一个
音频
文件(可能记录在audacity中)中提取出确切的二进制实现。我想要这个提取这些表示,以
识别
语音和声音,即一个基本的语音
识别
软件
。编辑-我想获得
音频
的波形,而不是图形,而是二进制表示,这样我就可以将语音转换为文本。
浏览 2
提问于2012-03-05
得票数 0
2
回答
语音到文本
识别
、
、
、
有没有可能编写一个语音到文本的
软件
,可以访问基于Googles网络的后端语音到文本系统?
浏览 0
提问于2011-08-16
得票数 4
回答已采纳
1
回答
来自雷达的
音频
信号比较
、
我们有一台雷达,可以通过耳机进行
音频
检测,以指示目标的类型。目标类型是(例如汽车/卡车/人)。雷达根据多普勒变化来区分这些目标,并将其向下转换为可听范围,操作员可以通过耳机听到。系统已经提供了与每种类型的目标(人/车/卡车)相对应的样本
音频
文件,以训练操作员知道当实况信号被馈送时他听到的是什么,并相应地确定它是什么目标。 我打算让一个
软件
来做这个操作员的工作。我想比较从雷达现场
音频
信号输入与7个不同的测试
音频
文件,并希望
软件
告诉我哪个文件匹配输入。
浏览 0
提问于2015-01-04
得票数 0
4
回答
腾讯语音
识别
和一句话
识别
,是一样的吗?
、
请描述您的问题 [附加信息]
浏览 895
提问于2018-05-29
点击加载更多
相关
资讯
怎么将音频转换成文字?可以识别音频为文字的软件有哪些
录音转文字免费的软件哪个好用?推荐这些识别音频文字的软件
音频转文字软件哪个好?音频转文字软件大分享
音频转文字软件哪个好?有没有音频转文字的软件?
音频识别转文字软件有哪些?三款软件教你录音转文字怎么弄
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券