首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >语音服务声称文本到语音的配额是200/秒,我不能超过20/min - 600倍的速度。

语音服务声称文本到语音的配额是200/秒,我不能超过20/min - 600倍的速度。
EN

Stack Overflow用户
提问于 2022-02-15 18:19:14
回答 2查看 279关注 0票数 0

使用Microsoft (Microsoft.CognitiveServices.Speech) 1.20.0,我正在尝试实现Azure认知服务文本到语音作为从Microsoft语音平台升级的功能。

文档(https://learn.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-services-quotas-and-limits#text-to-speech-quotas-and-limits-per-resource)显示每秒有200个事务,但是每次我测试它时,它都会以每分钟20次(慢600倍)的速度开始拒绝。这是在一个F0免费层上,尽管标准层也从200/s开始。

通过创建一个新的SpeechSynthesizer然后循环调用SpeakSsmlAsync进行基本测试,它在20/min时可靠地失败。等待每个调用,因此应该只有一个并发连接。在第21次调用时,结果立即被取消,错误是BadRequest“连接被远程主机关闭。错误代码: 1007。错误详细信息:由于太多的请求,USP状态: 3。接收到的音频大小:0字节。”

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2022-03-10 09:47:22

我在文档这里上发布了一个查询,现在它已经被更新,以澄清免费(F0)服务仅限于每60秒20

票数 0
EN

Stack Overflow用户

发布于 2022-02-25 06:10:12

根据我的研究,微软最近发布了一份关于如何使用利用语音SDK降低语音合成延迟的官方文件。

通常,我们通过第一个字节延迟和完成延迟来度量延迟。 在大多数情况下,第一个字节延迟比完成延迟要低得多。第一个字节延迟与文本长度无关,而完成延迟则随文本长度的增加而增加。 理想情况下,我们希望将用户体验的延迟(用户听到声音之前的延迟)降到一个网络路由旅行时间加上语音合成服务的第一个音频块延迟。

该解决方案支持C#、C++、Java、Python和Objective。我相信,通过实施给出的建议,你会得到一些更好的结果。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71131481

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档