输入文字转换成语音_文字转换成语音_语音转换成文字 - 腾讯云开发者社区

macos、speech-recognition

如何以编程方式使用OSX的语音到文本工具？OSX有离线的“增强听写”，这意味着在我电脑的某个地方，所有的数据都需要转换成语音。我想从可执行文件中调用这些功能。我已经看到一些AppleScript文件实际上是这样做的，但我无法让它们在OSX上工作。

浏览 4提问于2016-03-22得票数 2

回答已采纳

1回答

语音到文字是否发生在设备上？

android、voice、speech-to-text

(我没有开发android手机，目前只在模拟器上工作。由于模拟器没有语音输入方法，这些愚蠢的问题出现在我的脑海中。) 安卓是处理自己的设备上的语音输入(有限的计算能力为300-500MHz或1 GHz)，还是将其发送到Google，服务并获取文本？在脱机时工作吗？一次可以处理多长时间的语音输入而不中断？

浏览 2提问于2010-08-29得票数 1

回答已采纳

2回答

一种面向法语的文本语音软件

windows、gratis、speech-synthesis、french

我有一些法语文本，想把它们转换成MP3文件来听。有什么文字到语音软件推荐吗？我希望它是免费的，适用于Windows。注意:不一定要转换到MP3，只要它可以转换成音频文件，例如.wav，就可以了。

浏览 0提问于2017-05-11得票数 1

1回答

谷歌语音到文本输出json文件作为输入到文本到语音API？

google-cloud-speech

我有一个包含视频独白的音频文件。我不喜欢人的声音，所以我想把它转换成Google Cloud文本到语音的声音，特别是en-GB的女性声音。我能够使用API创建语音到文本的json文件，但是json文件的输出格式与文本到语音API使用的输入json格式不兼容。有没有办法将谷歌语音到文本引擎的输出作为文本到语音引擎的输入？

浏览 18提问于2019-08-15得票数 1

2回答

语音识别，如Siri

performance、speech-recognition、speech-to-text、siri

Siri等软件接受语音命令，并适当地回答这些问题(98%)。我想知道，当我们编写一个软件来接收语音信号的输入流并回答这些问题时，我们是否需要将输入转换成人类可读的语言？比如英语？和自然界一样，我们有很多不同的语言，但是当我们说话的时候，我们基本上会发出不同的声音。就这样。然而，我们创造了所谓的字母表来表示这些噪音的变化。因此，我的问题是，当我们编写语音识别算法时，是将这些噪声变化信号与我们的数据库匹配，还是首先将这些噪声变化转换成英语，然后检查从数据库中回答什么？。

浏览 0提问于2012-07-16得票数 3

回答已采纳

2回答

用于语音计算器的离线语音识别

android、speech-recognition、offline、calculator、voice-recognition

我正在构建一个应用程序“语音计算器”，它将输入作为语音，并根据输入显示结果。我不想使用谷歌服务器进行语音识别，有什么方法可以实现我的目标吗？我想把输入看作“二加三乘以422减一百”等，所以我想记录和比较每个单词，这些单词可以转换成文本，可以用来执行计算。有谁可以指导我，如何做到这一点？我已经完成了计算器的设计和它的功能，我希望我能够解释我的疑问，寻求帮助..谢谢你。

浏览 0提问于2011-08-16得票数 2

回答已采纳

1回答

使用Amazon文本到语音模拟音频文件中真实语音波形的语调

speech-recognition、text-to-speech、speech-to-text、amazon-polly

我想用Amazon制作出非常逼真的听起来的演讲--比允许Amazon从正常文本输入生成语音输出的结果更逼真。为了做到这一点，我想告诉Polly，尽它最大的努力，完全匹配一个给定的真实语音音频文件输入的样本，该输入是由一个声音演员发出的/记录的。换句话说，我想把话音演员产生的浊音语音转换成某种适合作为polly api输入的代码序列(例如音素、定时码等)，这样就可以产生一个音频文件输出，它应该尽可能地模仿原始记录的输入。某些AWS api是否以语音文件作为输入，并将其转换为一系列代码(例如音素和计时信息)，然后将其输入polly api以生成相应的语音回复？如果没有，第一步是否还需要使用其他a

浏览 0提问于2018-11-24得票数 1

1回答

如何使用PJSIP捕捉和翻译iOS客户端应用程序以其他语言输入的音频流？

ios、objective-c、audio、voip、pjsip

我想在基于VoIP的iOS客户端应用程序中集成语言转换器，它将根据用户的选择将实时输入的音频流转换成其他选定的语言，我正在使用PjSip开源库来支持VoIP调用。对于语言翻译，我想使用语音文本和文本到语音开源库。现在我面临以下问题：如何在PJSip中捕获输入的音频流？如何发送转换后的音频流，用户可以在正常的音频调用中收听？请help.Thanks。

浏览 2提问于2015-06-24得票数 0

2回答

python中的语音到文本

python、api、voice-recognition

假设我想用印地语或任何其他语言输入声音，它会给出英语(文本).How的输出，我能这样做吗？我知道的是:我知道如何把声音转换成文字。例如：信息提供: language=hindi输入: kese (语音)输出:你好吗？(案文)

浏览 24提问于2022-10-15得票数 -1

1回答

如何运行语音文本并将结果保存在变量中？

shell、assignment、speech-recognition

我想对着我的电脑麦克风说话，把我说的话转换成文本，然后把它作为shell变量使用。这个是可能的吗？我想我可以使用Google的语音输入功能： 📷

浏览 0提问于2015-12-29得票数 2

1回答

在Objective C/C中将字符串中的数值转换为整数

iphone、ios、objective-c、c、ios4

我随身带着一个NSString。此NSString是从语音引擎获取的。语音输入被转换为本机NSString。参见下面的字符串：“将温度设置为32度”。有没有办法把这个转换成“32度”呢？如果有一些第三方库可以进行这种转换，那将非常有帮助。否则，我将不得不创建一个复杂的逻辑来完成这项工作。

浏览 0提问于2013-08-02得票数 2

1回答

从自由格式STT输入查询子字符串

sql、string、postgresql、search

我有一个PostgreSQL数据库，其中包含表中的词汇表。我想接收语音到文本(STT)输入和查询我的词汇表的匹配。这很棘手，因为STT是某种形式的自由。假设该表包含以下词汇和短语：你好吗？嗨见到你很高兴小山好的并且提示用户说话："Hi, nice to meet you" 当输入输入为"Hi nice to meet you"时，我会转录它们的输入，并查询我的数据库中的单个词汇表匹配。我想回来： [ { id: 2, word: "Hi" }, { id

浏览 5提问于2020-12-01得票数 0

1回答

将数字的文本表示转换为整数

swift3、converter

我使用的是语音API，通常我得到的输入是数字，我需要把它转换成整数。例如： 427 将需要转换为 427 我不知道该怎么做，有什么东西是建立在斯威夫特的吗？

浏览 3提问于2017-04-04得票数 0

回答已采纳

2回答

电子书到AudioBook转换器

ebooks、speech-synthesis、audiobook

我正在寻找一个转换器(即文本到语音引擎或调用用户指定的文本到语音引擎的接口/覆盖)，它将把我的EBooks转换成AudioBooks：必须:支持至少html，pdf (文本)，mobi和azw作为输入类型(当然，更多的支持是很好的) 必须:输出在(用户可选择的) flac、wav或mp3中应:读取以OPF格式保存的元数据(即从量程)，并将其保存为音频文件中的元数据。应:将输出与输入文件并排保存。操作系统: Windows首选，但*nix可接受定价:免费提供会很好，但我对任何选择都感兴趣，只要他们至少有一个有限的试用版酷:允许用户向cmd行(或gui)传递要使用的语音引擎(和语音引擎

浏览 0提问于2014-02-23得票数 16

2回答

将mp3文件作为Json对象返回

android、json、web-services、rest、httpresponse

我有一个将输入文本转换成语音的应用程序，我想要做的是连接我的web服务和应用程序android，mp3文件在FTP服务器中，所以我希望当用户输入文本时，这个文本将发送到服务，然后通过算法将其连接到正确的语音文件中，以便将其返回到应用程序中，然后用户可以听它。我想使用REST web服务，我想使用JSON获取mp3文件，我如何将这个mp3文件作为JSON对象返回到应用程序，然后解析它？

浏览 12提问于2016-04-27得票数 0

回答已采纳

2回答

离子语中如何使用连续语音

angular、cordova、ionic2

我已经成功地将 API集成到我的项目(离子3)中。但是要输入语音，我每次都要打电话给this.speechRecognition.startListening。有任何方法可以继续作为服务器运行这个吗？因此，在任何时候，如果有人说了什么，它就会转换成文字。

浏览 0提问于2018-02-13得票数 3

1回答

如何将语音标记偏移量转换为时间

unity3d、amazon-polly

Amazon polly提供带有文本的语音标记。上面写着开始-输入文本中对象开始的偏移量(以字节(非字符)为单位)(不包括视位标记) 我怎样才能及时地将这个“开始”转换成一个开始位置，以便从那里开始阅读，例如使用Unity？

浏览 4提问于2020-06-02得票数 0

1回答

在iOS中将语音转换为文本

ios、speech-recognition

我正在寻找一个示例示例，它实现了open或任何其他语音识别器来将语音转换为文本。有什么教程可以帮我把课文转换成语音吗？

浏览 2提问于2013-05-03得票数 0

1回答

语音合成接口是由HTML5官方提供的吗？

html、text-to-speech、mozilla、w3c、speech-synthesis

我知道语音合成是用来将文本转换成语音的。但是它是由HTML5官方提供的吗？

浏览 25提问于2019-01-10得票数 0

回答已采纳

1回答

电子对文本的演讲

text、electron、audio-recording、speech

有办法用电子录音吗？我还想知道是否可以使用Google语音API将语音转换成电子文本。

浏览 1提问于2018-10-07得票数 2

1回答

如何大声朗读演讲会通知？

android

我正在开发一个用于语音信息的android文本消息application.When作为Toast通知接收到的消息，我想读取它-- aloud.So --如何将Toast通知中的消息作为语音读取。在我的项目中有3个类用于发送消息2)接收消息3)公共类Text2Speech扩展活动实现OnInitListener(转换为语音) 我希望将Toast类通知从接收类传递到 Text2Speech 类，以便将其转换为voice.Please，告诉我如何做到这一点，以及在收到消息通知时如何调用Text2Speech类。

浏览 1提问于2011-08-22得票数 0

1回答

快速-如何将保存的音频文件会话转换为文本？

ios、swift、speech-recognition、avaudioplayer、text-to-speech

我负责语音识别。我使用IOS框架解决文本到语音和语音到文本的问题。但是现在我想把保存下来的音频文件对话转换成文本。我怎么才能解决这个问题？谢谢你的回复。

浏览 0提问于2018-03-23得票数 8

回答已采纳

1回答

"sndfile.h“库的函数"sf_readf_float”出现问题

c++、wav、libsndfile

我有一个关于语音识别的项目。虽然我使用了"sndfile.h“库，但我仍然坚持阅读输入声音。我有一个问题:函数sf_readf_float()读取的数据是时域信号，不是吗？如果不是，那是什么呢？有没有什么公式可以把它转换成时域信号？

浏览 1提问于2013-07-07得票数 1

回答已采纳

1回答

如何以编程方式将阿塞拜疆文本转换为语音？

text-to-speech

我们有一个转换阿塞拜疆文本到语音编程的需要。有没有(最好是免费的)库或服务可以将文本转换成语音？

浏览 0提问于2020-01-28得票数 1

1回答

他们有没有针对Android的原始的“语音到文本”的英语引擎？

android、speech-to-text

我想把语音输入转换成英文的原始文本，如果我说我的名字"Babu Somasundaram"，那么它应该合成文本，尽管这不在字典中。另外，如果Android或任何其他第三方API不支持这种未来，有什么在线服务可以让我从我的android应用程序发出HTTP请求？提前感谢！

浏览 0提问于2011-05-04得票数 2

回答已采纳

2回答

在python中将文本转换为带旁白的视频

python、video、text-to-speech

我有很多文本，我想将它转换成音频，使用一些文本到语音的库，然后我想把音频转换成视频文件，如果屏幕是黑色的，或者文本是可视的，这无关紧要。无论如何，我真的不知道从哪里开始。有很多这样的代码，我需要做很多次，而且我非常熟悉python，但是我不知道我应该怎么做。有没有标准库可以把文本转换成python的语音？或者mp4中的音频？

浏览 3提问于2013-04-21得票数 0

回答已采纳

1回答

Voice XML禁用语音输入

voicexml、nexmo

我正在尝试在一段voice XML代码中禁用语音识别。我发现把一个项目从Twilio的TwiML转换成Nexmo所需的VoiceXML是相当困难的。这是我的代码。我尝试将<block>元素更改为<field>，这似乎禁用了语音输入，但随后我的<goto>无法工作。此外，与此特定问题无关，我如何以编程方式挂断呼叫者的电话？<disconnect/>似乎不起作用。 <vxml version="2.1"> <form> <block> <pro

浏览 6提问于2014-07-12得票数 1

1回答

VoiceXML和语音合成之间的工作流程是什么？

text-to-speech、voicexml

我想知道语音服务器的文本到语音引擎是如何呈现VoiceXML文档的。VXML文档将包含本应转换为音频文件的文本。如果TTS服务器理解MRCP，那么VXML文档转换成什么格式，这样语音服务器就能理解它，如何理解它？

浏览 0提问于2011-02-09得票数 2

回答已采纳

1回答

android中的文本到可视动画

android

我有一个android应用程序，我想在其中动画/可视化文本到语音。就像应用程序说出文本一样，该应用程序也会根据语音数据闪烁灯光。数据是可用的文本，我会转换成语音使用android的文本到语音。视觉表现就像一些基于语音闪烁的LEDS。有人能指导我如何提取语音数据(提取哪些特征)，然后如何将其映射到一些可视动画吗？谢谢，艾哈迈德

浏览 1提问于2012-09-07得票数 1

1回答

我们可以将文本转换为语音，或者相反吗？

java、blackberry、speech-recognition、text-to-speech

hie，我们可以在黑莓中将文本转换为语音，将语音转换为文本吗？有没有做这件事的api？我在市场上看到了一些应用程序，谁也在做同样的事情？怎样才能将文字转换成语音请帮我一下？谢谢..。

浏览 12提问于2010-09-01得票数 2

1回答

谷歌翻译API中的语音字符

ios、objective-c、xcode、google-translate、google-translation-api

我正在使用谷歌翻译API，这里有一个例子要求将英语中的“Hello”转换成简体中文：正如您所看到的，这几乎是它返回的所有数据：你好这对想要说它的用户没有多大帮助，谷歌翻译API也会返回任何拼音或语音输入，因此它可能会返回如下内容：倪浩谢谢!

浏览 1提问于2012-10-22得票数 1

回答已采纳

2回答

通过智能手机发送传真\android

android、voip、fax

我正在寻找通过android手机发送传真的方法。发送传真使用的是将语音转换成数据，通过打电话到远程传真播放我们都熟悉的声音，这已经在有线电话上做了多年了。那么，android手机怎么可能打电话到传真，把一些img文件转换成语音，然后把它调用的声音播放到其他传真呢？

浏览 8提问于2013-11-19得票数 1

回答已采纳

1回答

我现在需要的准确性OpenEars，语音库的IPhone使用CMUSphinx？

iphone、ipad、speech-to-text

您好，任何人谁使用过这个OpenEars，语音库的IPhone使用CMUSphinx，可以告诉我，它有多大的帮助语音到文本转换的iOS和多高的准确性我需要达到80%的语音应该转换成文本是这个库可以为我做这件事需要帮助提前谢谢。

浏览 0提问于2010-11-08得票数 2

回答已采纳

7回答

目前国内的语音识别技术达到了什么水准？还存在哪些问题？

语音识别

现在技术越来越厉害了，前几年还感觉语音打字特别不靠谱，各种语音助手也相当蠢萌，想问下现在国内语音识别发展到什么水平了？实时且准确的将语音转化成相对应的文本已经达到了什么样的水准？主要还存在哪些方面的问题？

浏览 2201提问于2018-08-06

1回答

在不自动填写和跟踪语音符号的情况下，从Microsoft扩展表格单元格中读取日文符号是否有任何方法？

components、spreadsheet、gooddata

在不自动填写和跟踪语音符号的情况下，从Microsoft扩展表格单元格中读取日文符号是否有任何方法？如果我打算通过CloudConnect电子表格阅读器组件从Microsoft电子表格中读取像“新”这样的日文符号，Microsoft会自动在内部向原始日语单元格值“新”提供语音符号线“シン”，而读取器读取不等于“新”之类的原始值，但将此语音符号添加为后缀，并将其读入为'新シン‘值。我想要的是配置读取器，不要读取这个语音尾随符号，而只读取它自己的原始单元格值，并且想知道这是如何可能的。

浏览 0提问于2014-11-11得票数 0

回答已采纳

2回答

录制音频中的音频处理

iphone、audio

我正在开发一个应用程序，其中我使用AVAudioRecorder录制和AVAudioPlayer播放音频文件。但我想做的是在录音之后，做一些语音处理，然后将其转换为卡通语音，然后播放音频。那么，有没有什么库或框架可以让我将录制的音频转换成卡通语音呢？

浏览 0提问于2010-12-23得票数 1

回答已采纳

2回答

如何从音频文件中提取文本

android

我正在制作一个应用程序，将音频转换为文本。我试过谷歌的语音转文本API，但当你按下一个图标时，它会同时识别语音，但我有一个音频文件，我想把它转换成文本。我搜索了很多，但我只得到了语音到文本。

浏览 3提问于2017-11-24得票数 1

2回答

如何让meSpeak.js读取特殊字符？

javascript、espeak

我想使用 (基于espeak的speak.js )进行文本到语音转换-它有一个捷克语语音文件-，但由于某种原因，它跳过了像ě，š，č，ř，ž这样的捷克语特殊字符，只读剩下的字符。当Windows上的espeak正确读取它们时，我尝试编译一个新的语音文件(cs.json)，但问题仍然存在。谢谢!

浏览 7提问于2015-07-25得票数 0

2回答

将文本转换为视频(mp4或mov或flv)

c#、video

有没有什么库可以把C#中的文本转换成视频，就像我们把文本转换成语音一样。

浏览 0提问于2010-09-22得票数 2

0回答

AI语音转文字让图片里面的嘴说话吗？

AI 互动体验展、语音

1、用户侧需录入语音转文本并作为消息发送到 ai侧。 2、ai,侧返回对应对话消息并转换成语音播放,且人物会随语音播放有说话的动作(口型与语音可以不一致，但要求是语音播放完毕后人物停止说话的动作)。 3、完成语音沟通后，在图6的聊天窗口中，需要体现所有语音聊天过程中的文本对话信息。(解释:就是在语音聊天过程中的对话信息也要展现在图6的对话框中，以文字展现) 4、默认情况下(在用户没有和ai沟通时)，用户只会轻微左右摇头、眨眼等动作。

浏览 22提问于2024-03-26

1回答

用于android的印地语/天成文书tts

android、text-to-speech、hindi

我计划做一个android应用程序。我想知道是否有任何tts引擎可以阅读印地语/天成文书文本。如果没有，还有什么tts引擎可以识别语音吗？如果是这样的话，有没有一种软件可以把印地语转换成英语语音呢？然后我可以让我的tts引擎读取语音。

浏览 2提问于2013-02-24得票数 1

1回答

有没有一种方法可以自动将Word语音指南转换为HTML <ruby>？

html

我有一些日语歌曲我翻译成意大利语，可能还有其他语言，我通过Microsoft Word的语音向导功能在每个汉字上都添加了furigana (平假名的发音)。所有这些迟早都会变成，这显然意味着要么失去语音指南，要么费尽心机地输入<ruby>、<rt>和</rt></ruby>一百万次，将语音指南转换成<ruby>并让它出现在帖子中。我使用的是安装了OS X 10.9.5 MacBook的Mavericks专业版，以防需要。我想知道:有没有办法让这个转换自动进行？对不起，这可能是，但我不知道还能去哪里找，因为谷歌“转换单词语音指南到HT

浏览 18提问于2018-01-16得票数 0

1回答

数据集中Wav音频文件的下采样

audio、dataset、speech-recognition、huggingface-transformers、huggingface-datasets

我已经从拥抱面部的LJ语音数据集进行自动语音识别训练。链接到数据集：音频的采样率是22050赫兹。我想把它转换成整个数据集的16000赫兹。代码和输出lj_data['audio'][0] 输出

浏览 6提问于2022-02-14得票数 1

1回答

将直接语音转换为报告语音的NLP技术

machine-learning、deep-learning、nlp

有没有什么NLP技术可以将直接的语音转换成报告的语音？示例转换：“我正在学习NLP”一位用户说：“一位用户说他正在学习NLP。我想过要翻译但不确定..。谢谢!

浏览 0提问于2021-08-23得票数 0

回答已采纳

1回答

在WebChat中，有没有办法检查用户输入文本框是否处于活动状态？

botframework、direct-line-botframework、web-chat

我使用机器人框架WebChat作为我的机器人的UI。对于我的场景，我需要知道用户当前是否正在通过语音或键入将一些数据输入到输入文本框中。在WebChat中有没有办法检查当前是否有一些输入被输入到输入框？我没有在我的应用程序中使用React，因此当与React一起托管时，可能无法使用WebChat提供的各种React钩子。

浏览 33提问于2020-04-13得票数 1

1回答

启动带有自定义Google命令的Android应用程序

android、android-intent、google-now

我看过其他一些问题，但从未见过我想要的答案。我可以进行一个活动来接收系统意图，例如传入的消息。谷歌现在的意图，如AlarmClock.ACTION_SET_ALARM，也可以收到应用程序。如何设置我的应用程序来接收自定义的Google语音命令？举个例子，现在在谷歌我想说好的，谷歌，应用程序名。然后，该应用程序将启动，并将有输入数据处理。这可以用塔斯克和AutoVoice完成，但我如何让我的安卓应用程序监听任何谷歌现在命令自己？

浏览 1提问于2014-12-18得票数 8

2回答

是否有任何方法来改变来电者的声音，使声音识别不可能？

privacy、identity、smartphone

我搜索并找到了这篇文章：是否可以用语音识别来识别手机用户？然而，它并没有回答我的问题。是否有任何方法改变一个人的声音，足以使手机呼叫无法识别的语音识别技术？

浏览 0提问于2019-08-29得票数 2

2回答

使用附加上下文改进Android语音识别

android、speech-recognition、speech-to-text

据我所知，Android使用google语音识别服务进行语音到文本。我已经学习了API，我发现它非常简单，只是将声音转换成文字数组。是否有任何方法来提高识别，我的意思是，如果我知道上下文，我可以发送一些参数到服务，以提高识别？或者，是否有任何其他语音识别服务可用于此目的？提前谢谢。

浏览 2提问于2015-03-19得票数 4

回答已采纳

1回答

phonegap/android中的文本演讲

android、cordova、speech-recognition、phonegap-plugins、speech-to-text

我正在开发一个android/phonegap应用程序。我有一张由客户填写的表格。我的客户想让我设计一个表单，把语音输入转换成文本。现在，我有以下一系列问题/澄清，每个运行在2.1以上的android手机都有语音搜索功能，所以没有必要在应用程序中添加该功能？如果我将该功能作为应用程序的一部分来实现，我应该在哪里实现--在android或phonegap中？我猜在phonegap中，因为我的UI在phonegap中。我有测试演讲识别phonegap插件和它的工作像一个魅力！！！如果我将该功能作为应用程序的一部分来实现，是否需要安装任何支持谷歌的应用程序(特别是: GoogleS

浏览 4提问于2012-12-12得票数 2

3回答

如何从语音文件中识别短语

c#、visual-studio-2010、speech-recognition

如何让引擎成功识别语音文件(wav/mp3/etc)中的短语？例如，如果我有一个语音文件和同一文件上下文的书面文本，以便让它识别语音文件中的书面文字。我试着尝试使用SpeechRecognitionEngine，但到目前为止都没有成功。我很欣赏这些想法，因为这是我第一次接触语音识别技术。我见过使用字典的语音到文本转换的示例，但我不确定它在这里如何有用。我想也许可以将所有的语音文件转换成文本，然后简单地在文本中查找特定的短语，但我认为这不是正确的方法。例如，将5小时的语音转换为文本似乎没有意义。或者可能使用特定短语作为“字典”，并在语音文件中查找该项。

浏览 2提问于2012-04-30得票数 4

回答已采纳