提交人像驱动任务

最近更新时间:2025-11-27 03:18:19

我的收藏

1. 接口描述

接口请求域名: vclm.tencentcloudapi.com 。

用于提交人像驱动任务
支持提交音频和图文来生成对应视频,满足动态交互、内容生产等场景需求。

默认接口请求频率限制:20次/秒。

推荐使用 API Explorer
点击调试
API Explorer 提供了在线调用、签名验证、SDK 代码生成和快速检索接口等能力。您可查看每次调用的请求内容和返回结果以及自动生成 SDK 调用示例。

2. 输入参数

以下请求参数列表仅列出了接口请求参数和部分公共参数,完整公共参数列表见 公共请求参数

参数名称 必选 类型 描述
Action String 公共参数,本接口取值:SubmitHumanActorJob。
Version String 公共参数,本接口取值:2024-05-23。
Region String 公共参数,详见产品支持的 地域列表
Prompt String 文本提示词,不能超过5000字符。
提示词支持全局和局部控制:

- 全局控制:正常输入提示词即可
- 局部控制:可用双井号进行特定时间的提示词约束,例如: "画面中的人物正在对着镜头讲话,偶尔做些手势匹配说话的内容。镜头保持固定。#3#画面中的人物正在对着镜头讲话,同时做出单手做向左方引导的手势。镜头保持固定。"(意思是第三秒的时候让人物做出左方引导手势)
-- 局部控制时间建议整数,最大可读小数点后两位。
示例值:"画面中的人物正在对着镜头讲话,偶尔做些手势匹配说话的内容"
AudioUrl String 传入音频URL地址,音频要求:
- 音频时长:2秒 - 60秒
- 音频格式:mp3、wav
- 音频大小:10M以内
示例值:https://cos.ap-guangzhou.myqcloud.com/audio.mp3
ImageUrl String 传入图片URL地址,图片要求:
- 图片格式:jpg、jpeg、png、bmp、webp
- 图片分辨率:192~4096
- 图片大小:不超过10M
- 图片宽高比:图片【宽:高】在1:4到4:1范围内
- 图片内容:避免上传无人脸、无宠物脸或脸部过小、不完整、不清晰、偏转角度过大、嘴部被遮挡的图片。
示例值:https://cos.ap-guangzhou.myqcloud.com/image.jpg
ImageBase64 String 传入图片Base64编码,编码后请求体大小不超过10M。
图片Base64编码与URL地址必传其一,如果都传以ImageUrl为准。
示例值:/9j/4QlQaHR0c...N6a2M5ZCI
Resolution String 生成视频分辨率
枚举值:720p,1080p
默认1080p
示例值:1080p
FrameRate Integer 生成视频帧数,单位fps。
枚举值:25,50
默认50帧
示例值:50
LogoAdd Integer 为生成视频添加标识的开关,默认为1。 1:添加标识。 0:不添加标识。 其他数值:默认按1处理。 建议您使用显著标识来提示,该视频是 AI 生成的视频。
示例值:1
LogoParam LogoParam 标识内容设置。 默认在生成视频的右下角添加“视频由 AI 生成”字样,您可根据自身需要替换为其他的标识图片。

3. 输出参数

参数名称 类型 描述
JobId String 任务ID。
示例值:1380069281965932544
RequestId String 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。

4. 示例

示例1 调用示例

输入示例

POST / HTTP/1.1
Host: vclm.tencentcloudapi.com
Content-Type: application/json
X-TC-Action: SubmitHumanActorJob
<公共请求参数>

{
    "Prompt": "画面中的人物正在对着镜头讲话,偶尔做些手势匹配说话的内容",
    "AudioUrl": "https://cos.ap-guangzhou.myqcloud.com/xxx.mp3",
    "ImageUrl": "https://cos.ap-guangzhou.myqcloud.com/xxx.jpg"
}

输出示例

{
    "Response": {
        "JobId": "1382369743251030016",
        "RequestId": "6f70a522-09c8-46c9-9e22-e6c2ab23ac3c"
    }
}

5. 开发者资源

腾讯云 API 平台

腾讯云 API 平台 是综合 API 文档、错误码、API Explorer 及 SDK 等资源的统一查询平台,方便您从同一入口查询及使用腾讯云提供的所有 API 服务。

API Inspector

用户可通过 API Inspector 查看控制台每一步操作关联的 API 调用情况,并自动生成各语言版本的 API 代码,也可前往 API Explorer 进行在线调试。

SDK

云 API 3.0 提供了配套的开发工具集(SDK),支持多种编程语言,能更方便的调用 API。

命令行工具

6. 错误码

该接口暂无业务逻辑相关的错误码,其他错误码详见 公共错误码