腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(1073)
视频
沙龙
1
回答
语音
到文本音频限制请求
本公司使用
语音
文字
API制作可搜索
的
有声读物。我们
的
一些
音频文件
达到20小时,但正如我们注意到
的
,使用
语音
文字
的
基本限制是480分钟。 请让我知道,我们怎样才能要求
把
限制扩大到1200分钟?
浏览 14
提问于2022-03-05
得票数 -1
回答已采纳
2
回答
一种面向法语
的
文本
语音
软件
、
、
、
有什么
文字
到
语音
软件
推荐吗?我希望它是免费
的
,适用于Windows。注意:不一定要转换到MP3,只要它可以转换成
音频文件
,例如.wav,就可以了。
浏览 0
提问于2017-05-11
得票数 1
1
回答
人形化身
的
动态文本
、
、
、
我是新
的
游戏开发,我使用冰封字符化身,并增加了一些基本
的
动画,
文字
到
语音
,面部动画。我
把
我所有的化身,动画通过3 3dxchange带到Unity3d,只有文本到
语音
音频文件
不能导入到Unity3D。我
的
问题是,我可能可以使用Unity3D中
的
独立
音频文件
,我在Iclone中手动输入了一个文本,以便化身发言,在那里,该
音频文件
保存在iclone中?我
的
目标是创建一个人形化身,它能够
浏览 2
提问于2015-05-14
得票数 1
回答已采纳
2
回答
是否有任何开源音素集(用于
语音
合成)?
、
、
我正在努力做一个超级基本
的
语音
合成器,我需要一些形式
的
音素
音频文件
,以便我可以
把
它们放在一起,并建立
文字
。是否有任何开放
的
音位设置,我可以使用这一点?
浏览 7
提问于2013-11-07
得票数 3
回答已采纳
2
回答
是否有任何方法来改变来电者
的
声音,使声音识别不可能?
、
、
我搜索并找到了这篇文章:然而,它并没有回答我
的
问题。 是否有任何方法改变一个人
的
声音,足以使手机呼叫无法识别的
语音
识别技术?
浏览 0
提问于2019-08-29
得票数 2
2
回答
寻找将
音频文件
转录为文本
的
方法
、
、
我通过使用我
的
Android智能手机对自己
的
声音进行重新编码,从而获取了很多备忘录。录音可以是快速笔记,也可以是长时间听写,因此它们
的
大小有很大差异。根据我使用
的
应用程序,我将音频保存为WAV或MP3文件。 我想做
的
是
把
这些
语音
备忘录和听写转换成文本文件。我在理论上发现了这种方法,它可以将音频回放到Google
的
语音
到文本API中,但我无法让它发挥作用。我已经按照指示,没有任何错误,我只是没有看到任何文本出现在Chrome界面。无论如
浏览 0
提问于2016-08-07
得票数 3
1
回答
Google
语音
识别时间戳
、
我有一个
音频文件
,而且我有那个
音频文件
的
准确记录。我希望能够在这个特定
的
文字
记录中得到每个单词
的
时间戳。有没有人知道谷歌
语音
识别是否有可能做到这一点?
浏览 3
提问于2020-04-25
得票数 1
1
回答
提取
音频文件
的
二进制表示
、
、
、
我想从一个
音频文件
(可能记录在audacity中)中提取出确切
的
二进制实现。我想要这个提取这些表示,以识别
语音
和声音,即一个基本
的
语音
识别
软件
。编辑-我想获得音频
的
波形,而不是图形,而是二进制表示,这样我就可以将
语音
转换为文本。
浏览 2
提问于2012-03-05
得票数 0
3
回答
可以产生不同口音
的
自然人声
的
软件
?
、
、
我正在为孩子们制作一个互动
的
应用程序,使用人类
的
声音进行互动;我需要一个
软件
,可以生成自然的人类
语音
(如TTS)或任何其他方式
的
音频文件
。该应用程序将使用
的
商业用途
的
音频文件
,我准备购买或许可
的
软件
。
浏览 0
提问于2013-03-14
得票数 0
1
回答
如何给予谷歌存储桶权限谷歌
语音
文本API?
、
我已经创建了谷歌存储桶,以执行谷歌
语音
到
文字
桶中
的
音频文件
。但这是不起作用
的
,因为桶是拒绝访问谷歌
语音
API。错误消息:匿名调用方没有storage.objects.get access PERMISSION_DENIED是否有可能让
语音
访问存储桶? 我还试着给桶
的
服务帐户许可。但不起作用。
浏览 2
提问于2019-07-08
得票数 0
回答已采纳
1
回答
是否有
文字
到
语音
软件
,允许您保存音频,以供以后使用?
、
、
、
所以,基本上,我正在寻找一个文本到
语音
软件
,它不仅可以读取我
的
文件给我(我目前使用Okular),还可以让我
把
演讲作为一个
音频文件
,以便我可以听它在其他地方
的
另一个时间。
浏览 0
提问于2018-04-05
得票数 3
回答已采纳
1
回答
带有音频url
的
azure
语音
到文本
、
、
、
、
嗨,我试过用
音频文件
来发短信,使用蓝色
的
语音
文字
,一切都正常工作。有人能指点我如何用音频url在蔚蓝中做讲稿吗?我正在使用REST。
浏览 4
提问于2022-10-06
得票数 0
回答已采纳
2
回答
Google
语音
识别库或API
、
、
、
谷歌最近在
语音
识别
软件
方面取得了很大进展,该
软件
被用于几个开源产品,例如Chromium 和Android免提短信。我想使用他们
的
语音
识别作为我
的
服务器堆栈
的
一部分,但我找不到太多关于它
的
信息。文本识别
软件
是否以库或
软件
包
的
形式提供?或者,我可以从另一个程序调用chromium,将一些
音频文件
转录成文本吗?
浏览 3
提问于2013-03-23
得票数 3
1
回答
谷歌
语音
识别是如何工作
的
?
我知道音频指纹识别
音频文件
,这是很棒
的
,但我真正想知道
的
是Google是如何制作
语音
识别API
的
,它们是如何获取音频和返回
的
单词
的
。我写了一个宝石来指纹wav
音频文件
并对它们进行比较,但是如果我用指纹将我
的
声音与充满指纹
的
数据库进行比较,可能要花费很长时间。谷歌是怎么做到
的
?用途: 我真的很喜欢
语音
识别,我想要一个地方开始编码,但我不知道从哪里开始。DragonVoice是
浏览 5
提问于2014-02-27
得票数 0
回答已采纳
2
回答
Windows
语音
识别
软件
,以
音频文件
为输入,输出文本文件
、
、
我对用于Windows
的
语音
识别
软件
感兴趣,它以一种标准格式(MP3、WAV、OGG等)获取播客
的
音频文件
,并将
语音
的
转录作为文本文件输出。其动机是帮助为官方wiki录制播客。我希望它能够教它,提高
语音
识别,或学习新单词。此外,它应该能够处理多人交谈,偶尔重叠
的
讲话,偶尔
的
音乐,或非说话
的
声音。 我只需要这个
软件
来处理英语。
浏览 0
提问于2014-04-14
得票数 5
2
回答
有没有
软件
可以在
语音
水平上输出
语音
到文本?
、
、
、
、
有没有
软件
能够接收
音频文件
并输出
语音
(IPA)文本? 据我所知,很多
软件
都是直接学习一门语言
的
,但是有没有一种是“可教”
的
呢?
浏览 0
提问于2009-10-23
得票数 7
1
回答
什么是好
的
语音
识别
软件
?
我正在运行Lubuntu15.04,我正在寻找一个
语音
识别
软件
,允许我打开和运行我
的
声音文件。在那里我可以定制,如果我说,因为我想要一个骑士凯特汽车
的
语音
识别,我想要能够与汽车交谈。当我说“嘿Kitt”时,它会打开一个
音频文件
并播放我选择
的
音频文件
。有什么建议吗?
浏览 0
提问于2015-06-25
得票数 0
1
回答
开发一款听觉训练
软件
,用什么工具好?
想开发一款听觉训练
的
软件
。根据回答
的
情况来做数据收集和分析。得出分析报告。 有些问题需要
语音
回答,需要识别
语音
来判断正误。这样一个
软件
用什么工具来开发好?
浏览 337
提问于2018-09-10
1
回答
如何收集和准备用于
语音
识别的数据?
、
据我所知,大多数
语音
识别实现都依赖于二进制文件,这些文件包含他们试图“识别”
的
语言
的
声学模型。一个人可以手动抄写大量
的
演讲,但这需要大量
的
时间。即便如此,当给出一个包含某些
语音
的
音频文件
,并在文本文件中对其进行完整
的
转录时,单个单词
的
发音仍然需要以某种方式分开。要匹配音频
的
哪一部分对应于文本,仍然需要
语音
识别。 这是怎么收集起来
浏览 6
提问于2015-08-03
得票数 2
回答已采纳
1
回答
基于MFCC
的
简单字检测器
、
、
我正在用Mel频率倒谱系数实现一个
语音
识别
软件
。特别是,系统必须识别单个指定
的
单词。由于
音频文件
,我得到一个矩阵中
的
MFCC 12行(MFCC)和许多列
的
语音
帧
的
数目。我给出了行
的
平均值,所以我得到了一个只有12行
的
向量(第1行是所有帧
的
所有ith-MFCC
的
平均值)。我
的
问题是如何训练一个分类器来检测单词?我有一个培训集,只有积极
的
样本,MFC
浏览 1
提问于2015-02-17
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券