有奖捉虫:办公协同&微信生态&物联网文档专题 HOT
使⽤该接⼝提交定制的请求,通过进度查询接口查询定制的各个阶段以及各阶段的相关信息。

调用协议

HTTPS + JSON
POST /v2/ivh/assetmanager/customservice/make
Header Content-Type: application/json;charset=utf-8

请求参数

参数
类型
必须
说明
AnchorName
string
主播名称:
1. 该名称主要用于标识该定制形象/声音,可以根据实际情况自定义
2. 命名参考:如果该主播定制的数量只有1个,可以直接以主播名称命名,例如“张三”;也可加上衣服名称来更好的标识,例如“张三蓝西服”等
3. 不超过50个字符,不少于2个字符,只允许有汉字、字母、数字、下划
4. 不能重名
MakeType
string
定制类别: IMAGE:2D小样本-标准版(专属口型)形象定制
IMAGE_GENERAL:2D小样本-标准版(通用口型)形象定制
IMAGE_4K:2D小样本-高精版(专属口型)形象定制
IMAGE_PHOTO:2D小样本(照片数智人)形象定制
VOICE:声音复刻(基础版) ZERO_SHOT_VOICE:声音复刻(极速版)
IdentityCosUrl
string
除 IMAGE_PHOTO、ZERO_SHOT_VOICE 定制类型无需填写外,其他定制类型与IdentityCosUrl 二选一或二者都填
视频格式授权书 URL,要求:
1. url 地址为通过上传素材到腾讯云 COS上传到指定路径的资源 url 地址后增加 idcard 路径,例如:域名/customer-pipline/{数字}/{uuid}/idcard/a.mp4
2. 该格式主要适用于“口述版授权书”,也可将“书面版授权书”拍成完整清晰的视频形式提交
IdentityWrittenCosUrl
string
除 IMAGE_PHOTO、ZERO_SHOT_VOICE 定制类型无需填写外,其他定制类型与IdentityCosUrl 二选一或二者都填
pdf 格式授权书 URL,要求:
1. url 地址为通过上传素材到腾讯云 COS上传到指定路径的资源url地址后增加 idcard 路径,例如:域名/customer-pipline/{数字}/{uuid}/idcard/b.pdf
2. 该格式主要适用于“书面版授权书”,以完整清晰的扫描件形式提交
MaterialCosUrl
string
除 ZERO_SHOT_VOICE 定制类型无需填写外,其他定制类型必填
形象定制素材 url 地址要求:
1. url 地址为通过上传素材到腾讯云 COS上传到指定路径的资源url地址后增加 video 路径,例如/customer-pipline/{数字}/{uuid}/video/c.mp4
2. 视频大小,不超过5GB,4K不超过10G
3. 视频时长:专属口型版本定制时长为2-10分钟;通用口型版本定制时长为1-10分钟;高精版本定制时长为2-10分钟
4. 视频分辨率:1080P、4K(3840*2160),如定制高精版,则必须为4K
5. 视频长宽比:16:9 (9:16)
6. 视频帧率:不低于25fps,不超过60fps
7. 视频格式:mp4,mov

声音定制素材 url 地址要求: 1. url 地址为通过上传素材到腾讯云 COS上传到指定路径的资源 url 地址后增加 audio 路径,例如/customer-pipline/{数字}/{uuid}/audio/c.zip 2. 压缩包格式:.zip 格式的压缩包,单个 zip 包用于定制1个音色;压缩时不要新建文件夹,直接选中所有 wav 压缩 3. 对于单个 zip 包里的音频注意事项: ①音频数量:每个 zip 包里可以包含1条或多条 wav 格式音频,总量不超过10条 ②音频大小:每个 zip 包里的音频大小总和不超过1G ③音频格式:每条音频需为 wav 格式,其他格式的音频请先转码为 wav 格式后再压缩成 zip 包 ④音频采样率:采样率大于等于24k即可,建议24k、36k ⑤音频命名:名称不要有空格或者特殊字符,后缀名需要为小写“.wav”

照片数智人定制素材 url 地址要求: 1. url地址为通过上传素材到腾讯云 COS上传到指定路径的资源 url 地址后增加 photo 路径,例如/customer-pipline/{数字}/{uuid}/photo/example.png 2. 图片格式:支持 jpg、png 格式,照片大小不超过10M;人物清晰正面照,脸部居中;表情自然,嘴部闭合;照片宽高比需满足1:1/9:16/16:9
IsHaveBackground
bool
形象定制类型,训练出来的形象是否带原始背景。默认“否”,即不带原始背景,在应用过程中可以按需更换背景
SexType
string
性别:
MALE:男
FEMALE:女
Notes
string
定制备注信息,100字以内
TextDriver
string
用于生成驱动demo的文本内容,字符长度在4-1000之间(包括ssml标签,单个中文算一个字符)
VoiceDriverCosFile
string
生成驱动 demo 的音频文件路径,要求:
1. url 地址为通过上传素材到腾讯云 COS上传到指定路径的资源 url 地址后增加 audio 路径,例如:/customer-pipline/{数字}/{uuid}/audio/example.wav
2. 音频文件大小不超过10M,格式支持wav、mp3、wma、m4a、aac
AudioId
string
ZERO_SHOT_VOICE 定制类型必填:填写查询音质检测任务进度通过后返回的 AudioId


返回参数

参数
类型
必须
说明
TaskId
string
制作的任务 ID,携带 TaskId 访问进度查询接口,可获得制作进度和制作结果

请求示例

{
"Header": {},
"Payload": {
"AnchorName": "静萱绿裙子坐姿",
"MakeType": "IMAGE",
"IdentityCosUrl": "XXXX",
"MaterialCosUrl": "YYYY",
"IsRemoveBackground": true
}
}

返回示例

{
"Header": {
"Code": 0,
"DialogID": "",
"Message": "",
"RequestID": "123"
},
"Payload": {
"TaskId": "666"
}
}