语音合成简介

概述

语音合成（Text To Speech，TTS）可以满足将文本转化成拟人化语音的需求，打通人机交互闭环。提供多种音色选择，支持自定义音量、语速，让发音更自然、更专业、更符合场景需求。语音合成广泛应用于智能体对话、语音助手、有声读物、新闻资讯播报等场景，提升人机交互体验，提高语音类应用构建效率。

您可以调用 API 进行语音合成操作，例如超自然大模型语音合成、大模型语音合成等。
语音合成支持的所有接口信息，请参见 API 概览。

术语表

语音合成 API 接口的常见术语请参见下表：

术语	描述
采样率	采样率（Sampling Rate）是指在数字信号处理中，每秒钟对连续信号进行采样的次数，通常以赫兹（Hz）为单位表示。采样率越高，数字信号对原始模拟信号的还原度越高，声音或图像的质量也越好。但同时，采样率越高，数据量也越大。

使用限制

对于 API 接口的参数限制，请参考各接口文档中的参数说明。

API 快速入门

您可以使用 API Explorer 工具在线调用 API。

本文以基础语音合成为例，通过 API Explorer 工具调用 API 接口的步骤如下：
1、注册腾讯云账号并通过实名认证后，登录语音合成控制台，阅读和同意服务条款，单击立即开通，即可获得语音合成的 API 接口调用权限。
2、进入 API Explorer 页面。更多 API Explorer 工具使用信息，请参见使用 API Explorer 。
3、调用语音合成接口。
4、输入相应参数后在线调用查看响应结果。具体输入参数说明可参见基础语音合成

更多操作指引请参见一分钟接入服务端 API。

简介

本页目录：

概述

术语表

使用限制

API 快速入门