不同的<prosody> ssml值在Google Text to Speech中生成相同的音频

文章/答案/技术大牛

发布

1回答

google-text-to-speech、ssml

在使用WaveNet语音时使用ssml时，无法生成不同的音频波形。 <prosody rate="slow" pitch="-2st">Can you hear me now?</prosody> <prosody rate="medium" pitch="1st">Can you hear me now?&l

浏览 18提问于2019-04-30得票数 5

1回答

无法通过google Cloud文本到语音中的韵律控制音量。

ssml

SSML音量属性对输出音频没有影响<speak> <s><prosody volume = "+6dB"> This is a sentence with volume 6 For GOOGL

浏览 1提问于2019-05-05得票数 1

1回答

Google的速度和音高韵律属性

google-cloud-platform、google-text-to-speech

我对Google Cloud的文本到语音是陌生的。显示带有rate和pitch属性的<prosody>标记。但这些并没有改变我的要求。例如，如果我使用rate="slow"或rate="fast"，或者pitch="+2st"或pitch="-2st"，结果与docs上的示例相同，并且不同，后者的速率较慢，音调较低。<&

浏览 0提问于2021-08-11得票数 1

回答已采纳

2回答

创建一个将文本转换为音频的网站(Google文本到语音API)

google-cloud-platform、text-to-speech、google-cloud-speech、google-text-to-speech

我想做一个简单的网站使用Google文本到语音API。我搜索过“开发一个将文本转换为音频的网站”。我找到了这个地方。然而，没有满足我的要求。你能给我任何信息来开发一个将

浏览 1提问于2019-12-29得票数 0

回答已采纳

2回答

Google Actions支持SSML吗？

actions-on-google、dialogflow-es、ssml

我可以在上看到Google上的操作确实支持SSML，但是我在我的代理中遇到了问题。<speak>First sentence. <break time="1s"/> Second sentence.<prosody pitch=&q

浏览 34提问于2018-02-22得票数 1

2回答

有没有办法让Google* Text to Speech，在想要的时间内说出文本？*

text-to-speech、google-speech-api、google-text-to-speech、ssml

我浏览了Google Text to Speech SSML的文档。因此有一个名为<Prosody/>的标记，根据的文档，它可以接受一个名为duration的属性，它是读取包含的文本所需时间的秒数或毫秒数。所以<speak><prosody duration='6s'>Hello, How are you?<&

浏览 18提问于2020-05-31得票数 0

1回答

谷歌语音API能把文字转换成语音吗？

python-3.x、google-api、google-speech-api

audio = r.listen(source) GOOGLE_CLOUD_SPEECH_CREDENTIALS= r"""{KEY}# INSERT THE CONTENTS OF THE GOOGLE CLOUD SPEECH JSON CREDENTIALS FILE HERE try:speechOut

浏览 0提问于2018-05-06得票数 1

回答已采纳

2回答

如何使用Python文本生成mp3文件

python、azure、mp3、text-to-speech

我能够生成一个wav文件的“玛丽有一个小羊羔”使用下面的代码。但是当我试图生成一个mp3时，它失败了。#https://learn.microsoft.com/en-us/azure/cognitive-services/speech-service/get-started-text-to-speechrate="{speakingRate}" pitch="{pitch}"&g

浏览 18提问于2022-01-08得票数 0

3回答

只播放SSML中的音频应答？

actions-on-google

我想知道是否可以在我的SSML中不包含文本，因为我的音频文件说‘你准备好玩了吗？’，我不需要任何来自谷歌助理本身的演讲。

浏览 0提问于2018-10-01得票数 1

回答已采纳

0回答

SSML在Google上的行动--韵律

google-assistant-sdk

我在Google上调整了SSML的动作，我认为我做得对，但测试应用程序没有改变韵律中的速率和音调(音频部分工作正常)： conv.close(`<speak>${conv.data.userName<prosody rate="x-fast" pitch="+5st">Can you hear me now?</prosody>, your l

浏览 2提问于2018-07-15得票数 0

1回答

由于Ssml响应的空语音响应，无法将对话框流响应解析为AppResponse

dialogflow-es、actions-on-google

试图找出正确的对话框流实现webhook json响应。Json是由AWS上的.NET Core生成的。": { "text": null, "richResponse": {"

浏览 0提问于2018-08-20得票数 0

1回答

使用Python向DialogFlow发送音频文件

python、dialogflow-es、api-ai

我知道，我可以通过以下方式使用DialogFlow将数据(本例中的文本)发送到：request = ai.text_requestUSER>"response = request.getresponse()但是我不确定我是否可以把一个音频文件发送到

浏览 1提问于2018-05-24得票数 0

回答已采纳

1回答

Windows Phone 8在真实设备上使用SSML* - <Prosody>标记异常进行文本到语音转换*

windows-phone-8、text-to-speech、ssml

我正在WP8上实现简单的语音识别和合成。当我在模拟器中测试应用程序时，一切正常。但是，当我在物理设备(HTC Windows Phone X8)上测试该应用程序时，出现了一个关于SSML合成的问题。这段SSML代码运行得很好： xmlns<&

浏览 5提问于2013-04-03得票数 0

回答已采纳

2回答

如何在ssml中使用带有不同声音的voice元素？

google-cloud-platform、text-to-speech、google-text-to-speech

我尝试使用Google Text- to -Speech API生成音频文件。因为我需要在对话框中使用不同的声音，所以我尝试使用ssml的voice元素：<voice languages="en-US" gender="female" name="en-US-Wavenet-F</voice> </speak&g

浏览 2提问于2019-05-02得票数 1

2回答

如何从Google* Cloud text- to -speech API获取SSML <mark>时间戳*

markers、google-cloud-speech、google-text-to-speech、ssml

我想通过Google Cloud text- to -speech API使用来请求音频流中这些标记的计时。这些时间戳是必需的，以便向用户提供效果、单词/部分突出显示和反馈的提示。我发现是相关的，尽管问题指的是每个单词的时间戳，而不是SSML <mark>标记。下面的API请求返回OK，但显示缺少请求的标记数据。这是在使用Cloud <em

浏览 56提问于2019-08-07得票数 14

1回答

如何访问Google文本到语音测试版(2021年3月1日)

beta、google-text-to-speech

在2021年3月1日，，包括对带有name或lang属性的ssml <voice>标记的支持。<speak> Blah Blah English Text. <voice name="ko-KR-Wavenet-D"> Blah Blah Korean Text.</

浏览 3提问于2021-03-19得票数 3

2回答

如何将Google文本中的grpc.max_receive_message_length配置更改为NodeJS上的语音？

node.js、typescript、grpc、google-text-to-speech、grpc-node

我使用包@google-cloud/text-to-speech将文本转换为语音，大致使用以下代码：const fs = require('fs'); /&

浏览 8提问于2021-12-04得票数 1

回答已采纳

1回答

(/env/lib/python3.7/site-packages/flask/app.py:1935) [ Google上的dispatch_request ]

python、google-app-engine、flask、text-to-speech、google-text-to-speech

是一个带有文本框的网站，您在文本框中输入一个句子，然后单击“提交”按钮，您可以下载由Google文本生成的mp3文件到Speech API我的学生开始使用这个网络应用程序，然后我在Google平台的控制台中发现了错误信息。谷歌云平台的控制台“错误报告

浏览 4提问于2020-04-04得票数 0

1回答

我在用用python编写的web钩子的DialogFlow(api.ai)中播放音频时遇到了问题

json、actions-on-google、dialogflow-es、ssml

在python web钩子中，我返回JSON响应为- "speech":"Speak this", } "fulfillment":

浏览 0提问于2018-03-10得票数 0

2回答

如何为AWS Polly将srt文件转换为SSML增强文本？

amazon-web-services、text-to-speech、srt、amazon-polly

我们有一些校对的.srt文件，我们想从他们产生音频由AWS。根据AWS Polly上的引用，Polly的输入类型要么是纯文本，要么是SSML增强文本。有办法将.srt文件转换为SSML增强型文本吗？我们希望使用.srt文件，因为它们是校对的，它们在文件中记录“音频暂停”信息。在00:00:09220到00:00:09,500之间有一个缺口，这是我们拥有的“音频暂停”信息。AWS P

浏览 8提问于2019-11-20得票数 2

点击加载更多