概述
语音合成(Text To Speech,TTS)可以满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多种音色选择,支持自定义音量、语速,让发音更自然、更专业、更符合场景需求。语音合成广泛应用于智能体对话、语音助手、有声读物、新闻资讯播报等场景,提升人机交互体验,提高语音类应用构建效率。
您可以调用 API 进行语音合成操作,例如超自然大模型语音合成、大模型语音合成等。
语音合成支持的所有接口信息,请参见 API 概览 。
术语表
语音合成 API 接口的常见术语请参见下表:
术语 |
描述 |
---|---|
采样率 | 采样率(Sampling Rate)是指在数字信号处理中,每秒钟对连续信号进行采样的次数,通常以赫兹(Hz)为单位表示。采样率越高,数字信号对原始模拟信号的还原度越高,声音或图像的质量也越好。但同时,采样率越高,数据量也越大。 |
使用限制
对于 API 接口的参数限制,请参考各接口文档中的参数说明。
API 快速入门
您可以使用 API Explorer 工具在线调用 API。
本文以基础语音合成为例,通过 API Explorer 工具调用 API 接口的步骤如下:
1、注册腾讯云账号并通过实名认证后,登录 语音合成控制台 ,阅读和同意服务条款,单击立即开通,即可获得语音合成的 API 接口调用权限。
2、进入 API Explorer 页面。更多 API Explorer 工具使用信息,请参见 使用 API Explorer 。
3、调用 语音合成 接口。
4、输入相应参数后在线调用查看响应结果。具体输入参数说明可参见 基础语音合成
更多操作指引请参见 一分钟接入服务端 API。