把音频文件的语音转化成文字导出来软件 - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

语音到文本音频限制请求

本公司使用语音文字API制作可搜索的有声读物。我们的一些音频文件达到20小时，但正如我们注意到的，使用语音文字的基本限制是480分钟。请让我知道，我们怎样才能要求把限制扩大到1200分钟？

浏览 14提问于2022-03-05得票数 -1

回答已采纳

2回答

一种面向法语的文本语音软件

、、、

有什么文字到语音软件推荐吗？我希望它是免费的，适用于Windows。注意:不一定要转换到MP3，只要它可以转换成音频文件，例如.wav，就可以了。

浏览 0提问于2017-05-11得票数 1

1回答

人形化身的动态文本

、、、

我是新的游戏开发，我使用冰封字符化身，并增加了一些基本的动画，文字到语音，面部动画。我把我所有的化身，动画通过3 3dxchange带到Unity3d，只有文本到语音音频文件不能导入到Unity3D。我的问题是，我可能可以使用Unity3D中的独立音频文件，我在Iclone中手动输入了一个文本，以便化身发言，在那里，该音频文件保存在iclone中？我的目标是创建一个人形化身，它能够

浏览 2提问于2015-05-14得票数 1

回答已采纳

2回答

是否有任何开源音素集(用于语音合成)？

、、

我正在努力做一个超级基本的语音合成器，我需要一些形式的音素音频文件，以便我可以把它们放在一起，并建立文字。是否有任何开放的音位设置，我可以使用这一点？

浏览 7提问于2013-11-07得票数 3

回答已采纳

2回答

是否有任何方法来改变来电者的声音，使声音识别不可能？

、、

我搜索并找到了这篇文章：然而，它并没有回答我的问题。是否有任何方法改变一个人的声音，足以使手机呼叫无法识别的语音识别技术？

浏览 0提问于2019-08-29得票数 2

2回答

我通过使用我的Android智能手机对自己的声音进行重新编码，从而获取了很多备忘录。录音可以是快速笔记，也可以是长时间听写，因此它们的大小有很大差异。根据我使用的应用程序，我将音频保存为WAV或MP3文件。我想做的是把这些语音备忘录和听写转换成文本文件。我在理论上发现了这种方法，它可以将音频回放到Google的语音到文本API中，但我无法让它发挥作用。我已经按照指示，没有任何错误，我只是没有看到任何文本出现在Chrome界面。无论如

浏览 0提问于2016-08-07得票数 3

1回答

Google语音识别时间戳

、

我有一个音频文件，而且我有那个音频文件的准确记录。我希望能够在这个特定的文字记录中得到每个单词的时间戳。有没有人知道谷歌语音识别是否有可能做到这一点？

浏览 3提问于2020-04-25得票数 1

1回答

提取音频文件的二进制表示

、、、

我想从一个音频文件(可能记录在audacity中)中提取出确切的二进制实现。我想要这个提取这些表示，以识别语音和声音，即一个基本的语音识别软件。编辑-我想获得音频的波形，而不是图形，而是二进制表示，这样我就可以将语音转换为文本。

浏览 2提问于2012-03-05得票数 0

3回答

可以产生不同口音的自然人声的软件？

、、

我正在为孩子们制作一个互动的应用程序，使用人类的声音进行互动；我需要一个软件，可以生成自然的人类语音(如TTS)或任何其他方式的音频文件。该应用程序将使用的商业用途的音频文件，我准备购买或许可的软件。

浏览 0提问于2013-03-14得票数 0

1回答

如何给予谷歌存储桶权限谷歌语音文本API？

、

我已经创建了谷歌存储桶，以执行谷歌语音到文字桶中的音频文件。但这是不起作用的，因为桶是拒绝访问谷歌语音API。错误消息:匿名调用方没有storage.objects.get access PERMISSION_DENIED是否有可能让语音访问存储桶？我还试着给桶的服务帐户许可。但不起作用。

浏览 2提问于2019-07-08得票数 0

回答已采纳

1回答

是否有文字到语音软件，允许您保存音频，以供以后使用？

、、、

所以，基本上，我正在寻找一个文本到语音软件，它不仅可以读取我的文件给我(我目前使用Okular)，还可以让我把演讲作为一个音频文件，以便我可以听它在其他地方的另一个时间。

浏览 0提问于2018-04-05得票数 3

回答已采纳

1回答

带有音频url的azure语音到文本

、、、、

嗨，我试过用音频文件来发短信，使用蓝色的语音文字，一切都正常工作。有人能指点我如何用音频url在蔚蓝中做讲稿吗？我正在使用REST。

浏览 4提问于2022-10-06得票数 0

回答已采纳

2回答

Google语音识别库或API

、、、

谷歌最近在语音识别软件方面取得了很大进展，该软件被用于几个开源产品，例如Chromium 和Android免提短信。我想使用他们的语音识别作为我的服务器堆栈的一部分，但我找不到太多关于它的信息。文本识别软件是否以库或软件包的形式提供？或者，我可以从另一个程序调用chromium，将一些音频文件转录成文本吗？

浏览 3提问于2013-03-23得票数 3

1回答

谷歌语音识别是如何工作的？

我知道音频指纹识别音频文件，这是很棒的，但我真正想知道的是Google是如何制作语音识别API的，它们是如何获取音频和返回的单词的。我写了一个宝石来指纹wav音频文件并对它们进行比较，但是如果我用指纹将我的声音与充满指纹的数据库进行比较，可能要花费很长时间。谷歌是怎么做到的？用途：我真的很喜欢语音识别，我想要一个地方开始编码，但我不知道从哪里开始。DragonVoice是

浏览 5提问于2014-02-27得票数 0

回答已采纳

2回答

Windows语音识别软件，以音频文件为输入，输出文本文件

、、

我对用于Windows的语音识别软件感兴趣，它以一种标准格式(MP3、WAV、OGG等)获取播客的音频文件，并将语音的转录作为文本文件输出。其动机是帮助为官方wiki录制播客。我希望它能够教它，提高语音识别，或学习新单词。此外，它应该能够处理多人交谈，偶尔重叠的讲话，偶尔的音乐，或非说话的声音。我只需要这个软件来处理英语。

浏览 0提问于2014-04-14得票数 5

2回答

有没有软件可以在语音水平上输出语音到文本？

、、、、

有没有软件能够接收音频文件并输出语音(IPA)文本？据我所知，很多软件都是直接学习一门语言的，但是有没有一种是“可教”的呢？

浏览 0提问于2009-10-23得票数 7

1回答

什么是好的语音识别软件？

我正在运行Lubuntu15.04，我正在寻找一个语音识别软件，允许我打开和运行我的声音文件。在那里我可以定制，如果我说，因为我想要一个骑士凯特汽车的语音识别，我想要能够与汽车交谈。当我说“嘿Kitt”时，它会打开一个音频文件并播放我选择的音频文件。有什么建议吗？

浏览 0提问于2015-06-25得票数 0

1回答

开发一款听觉训练软件，用什么工具好？

想开发一款听觉训练的软件。根据回答的情况来做数据收集和分析。得出分析报告。有些问题需要语音回答，需要识别语音来判断正误。这样一个软件用什么工具来开发好？

浏览 337提问于2018-09-10

1回答

如何收集和准备用于语音识别的数据？

、

据我所知，大多数语音识别实现都依赖于二进制文件，这些文件包含他们试图“识别”的语言的声学模型。一个人可以手动抄写大量的演讲，但这需要大量的时间。即便如此，当给出一个包含某些语音的音频文件，并在文本文件中对其进行完整的转录时，单个单词的发音仍然需要以某种方式分开。要匹配音频的哪一部分对应于文本，仍然需要语音识别。这是怎么收集起来

浏览 6提问于2015-08-03得票数 2

回答已采纳

1回答

基于MFCC的简单字检测器

、、

我正在用Mel频率倒谱系数实现一个语音识别软件。特别是，系统必须识别单个指定的单词。由于音频文件，我得到一个矩阵中的MFCC 12行(MFCC)和许多列的语音帧的数目。我给出了行的平均值，所以我得到了一个只有12行的向量(第1行是所有帧的所有ith-MFCC的平均值)。我的问题是如何训练一个分类器来检测单词？我有一个培训集，只有积极的样本，MFC

浏览 1提问于2015-02-17得票数 0

点击加载更多

语音到文本音频限制请求

一种面向法语的文本语音软件

人形化身的动态文本

是否有任何开源音素集(用于语音合成)？

是否有任何方法来改变来电者的声音，使声音识别不可能？

寻找将音频文件转录为文本的方法

Google语音识别时间戳

提取音频文件的二进制表示

可以产生不同口音的自然人声的软件？

如何给予谷歌存储桶权限谷歌语音文本API？

是否有文字到语音软件，允许您保存音频，以供以后使用？

带有音频url的azure语音到文本

Google语音识别库或API

谷歌语音识别是如何工作的？

Windows语音识别软件，以音频文件为输入，输出文本文件

有没有软件可以在语音水平上输出语音到文本？

什么是好的语音识别软件？

开发一款听觉训练软件，用什么工具好？

如何收集和准备用于语音识别的数据？

基于MFCC的简单字检测器

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐