声音复刻

最近更新时间:2025-09-29 19:21:09

我的收藏
注意:
本页面只适用一句话版声音复刻。




流程说明

1. 获取声音复刻训练文本

通过调用获取声音复刻训练文本接口得到训练文本。客户需要将文本对应复刻训练音频交由音质检测接口进行音质检测。
POST / HTTP/1.1
Host: vrs.tencentcloudapi.com
Content-Type: application/json
X-TC-Action: GetVrsTrainingText

{
"Response": {
"Data": {
"TrainingTextList": [
{
"Text": "周六 周日个人免费进入 周一到周五只接受包场 五百元半个小时 ",
"TextId": "c7645ae3-cb27-4b4d-8009-2acf046e4a75"
}
]
},
"RequestId": "2a3f440a-d351-455f-ae0d-b67d835a8e2c"
}
}

2. 环境检测和音频质量检测

音质检测用于检测复刻训练音频质量,保证最终复刻的音色效果。接口检测通过后会返回音频的 AudioId,客户需要保存该 AudioId 用于创建复刻任务接口使用。(注意:请求参数中的 TextId 来源获取训练文本接口返回的 TextId,该TextId标识文本内容。AudioData为Base64 加密后的音频数据。)
POST / HTTP/1.1
Host: vrs.tencentcloudapi.com
Content-Type: application/json
X-TC-Action: DetectionEnvAndSoundQuality
<公共请求参数>

{
"TextId": "00001",
"AudioData": "UklGRqTOAQBXQVZFZm10IBAAAAABAAEAg.......AAAAAAAAAAAAAAAAAAAA==",
"Codec": "wav",
"TypeId": 2,
"SampleRate": 16000
}
{
"Response": {
"Data": {
"AudioId": "audio29b7ff1d2bd74ba887712cedb280d563",
"DetectionCode": 0,
"DetectionMsg": "Success",
"DetectionTip": []
},
"RequestId": "6aace114-dddf-4ee9-9086-a6ffe6d88e6f"
}
}
如果未通过可参考响应结果的 Words 判断音频问题。包含准确度、流畅度、以及错读少读等情况。




3. 声音复刻任务创建接口

训练文本对应训练音频通过音质检测后,通过声音复刻任务创建接口创建复刻音色任务。任务创建成功后会返回 TaskId,可通过 TaskId 查询任务状态。
POST / HTTP/1.1
Host: vrs.tencentcloudapi.com
Content-Type: application/json
X-TC-Action: CreateVRSTask
<公共请求参数>

{
"SessionId": "63f8xxx1897281d556df60b0",
"VoiceName": "测试",
"SampleRate": 16000,
"VoiceGender": 1,
"VoiceLanguage": 1,
"Codec": "wav",
"CallbackUrl": "http://example.com/callback",
"AudioIdList": [
"audio29b7ff1d2bd74ba887712cedb280d563"
}
{
"Response": {
"RequestId": "63f89bb1897281d556df60b0",
"Data": {
"TaskId": "ce68122c-0ca8-4fa6-99b1-90a2867"
}
}
}

4. 声音复刻任务结果查询接口

通过声音复刻任务创建接口返回的 TaskId 查询任务状态,训练成功后会返回复刻音色的 VoiceType。复刻任务一般五分钟可训练完成。
POST / HTTP/1.1
Host: vrs.tencentcloudapi.com
Content-Type: application/json
X-TC-Action: DescribeVrsTaskStatus
<公共请求参数>

{
"TaskId":"ce68122c-0ca8-4fa6-99b1-90a2867"
}

{
"Response": {
"Data": {
"TaskId": "ce68122c-0ca8-4fa6-99b1-90a2867",
"Status": 2,
"StatusStr": "waiting in queue",
"VoiceType": 200000000,
"FastVoiceType": "WCHN-353xxxx0f3eace0c1",
"ErrorMsg": ""
},
"RequestId": "63f43c3d6e30af6bd63735b0"
}
}

5. 基础语音合成

根据训练成功后返回的 VoiceType 调用 基础语音合成 进行使用。

FAQ

离线任务类型适用于什么场景?

离线任务适用于不联网需要本地部署复刻后的音色模型场景。一般使用在线任务即可。