已支持模型能力如下:
模型名称(Vendor) | 产品能力 |
HY | 图生视频 |
Vidu | 文生视频 图生视频 参考生视频 |
Kling | 文生视频 图生视频 可灵O1 |
一. HY
图生视频
参数名称 | 必选 | 类型 | 描述 |
Image | 否 | String | 输入图片 url。 上传图片 url 大小不超过 8M。 支持格式: jpg、png、jpeg、webp、bmp、tiff 。 单边分辨率不超过5000,不小于50,长宽限制1:4~4:1。 |
Resolution | 否 | String | 输出视频分辨率。 可选值:480p、720p、1080p。 示例值:480p |
Fps | 否 | Integer | 生成视频的帧率。 可选值:16、 24、 30,默认值:30。 示例值:30 |
二. Vidu
文生视频
参数名称 | 必选 | 类型 | 描述 |
Duration | 否 | Integer | 视频时长参数。 viduq3-pro、viduq3-turbo 默认为 5,可选:1 - 16。 viduq2-pro、viduq2-turbo 默认为 5,可选:1 - 10。 示例值:5 |
Bgm | 否 | Boolean | 是否为生成的视频添加背景音乐。 可选值:true 、false,默认:false。 传 true 时系统将从预设 BGM 库中自动挑选合适的音乐并添加;不传或为 false 则不添加 BGM。 BGM 不限制时长,系统根据视频时长自动适配。 示例值:true |
AspectRatio | 否 | String | 比例。 可选值:16:9、9:16、4:3、3:4、1:1,默认 16:9。 示例值:16:9 |
Resolution | 否 | String | 分辨率参数。 可选值:540p、720p、1080p,默认 720p。 示例值:720p |
图生视频
参数名称 | 必选 | 类型 | 描述 |
Images.N | 是 | Array of String | 首帧图像。 上传单张图时:模型将以此参数中传入的图片为首帧画面来生成视频。 支持传入图片URL(确保可访问)。 支持上传1 - 2 张图。 图片支持 png、jpeg、jpg、webp格式。 图片比例需要小于 1:4 或者 4:1。 图片大小不超过10M。 上传两张图时:上传的第一张图片视作首帧图,第二张图片视作尾帧图,模型将以此参数中传入的图片来生成视频。 首尾帧两张输入图的分辨率需相近,首帧图的分辨率/尾帧图的分辨率要在0.8~1.25之间。且图片比例需要小于1:4或者4:1。 支持传入图片URL(确保可访问)。 图片支持 png、jpeg、jpg、webp格式。 图片大小不超过10M。 |
IsRec | 否 | Boolean | 是否使用推荐提示词,默认关闭。 true:是,由系统自动推荐提示词,并使用提示词内容生成视频,推荐提示词数量=1。 false:否,根据输入的 prompt 生成视频。 示例值:true 注意: 启用推荐提示词后,每个任务多消耗1积分。 |
Audio | 否 | Boolean | 是否使用音视频直出能力,默认 false 关闭,枚举值为: false:不需要音视频直出,输出静音视频。 true:需要音视频直出,输出带台词以及背景音的视频。 示例值:true 注意: 该参数为 true 时,voice_id 参数才生效。 仅上传单张图时有效。 |
VoiceId | 否 | String | 音色 id。 用来决定视频中的声音音色,为空时系统会自动推荐,可选枚举值参考 新音色列表。 暂不支持声音复刻功能。 示例值:male-qn-qingse 注意: 仅上传单张图时有效。 |
Duration | 否 | Integer | 视频时长参数。 图生视频: 默认5秒,可选:1-10(整数) 首尾帧生视频: 默认5秒,可选:1-8(整数) 示例值:5 |
Resolution | 否 | String | 分辨率参数 可选值:540p、720p、1080p,默认 720p。 示例值:720p |
MovementAmplitude | 否 | String | 运动幅度。 可选值:auto、small、medium、large,默认 auto。 示例值:auto |
BGM | 否 | bool | 是否为生成的视频添加背景音乐。默认:false、 可选值:true 、false。 传 true 时系统将从预设 BGM 库中自动挑选合适的音乐并添加;不传或为 false 则不添加 BGM。 BGM不限制时长,系统根据视频时长自动适配 注意: 仅首尾帧生视频支持此参数。 |
Seed | 否 | Int | 随机种子。 当默认不传或者传 0 时,会使用随机数替代。 手动设置则使用设置的种子。 |
参考生视频
参数名称 | 必选 | 类型 | 描述 |
Subjects | 否 | List[Array] | 图片主体信息支持1-7个主体,主体图片共1~7张。 |
Subjects id | 否 | String | 主体 id,后续生成时可以通过@主体 id 的方式使用。 |
Subjects images | 否 | Array{String} | 该主体对应的图片 url。 每个主体最多支持3张图片。 支持传入图片 URL(确保可访问)。 图片支持 png、jpeg、jpg、webp 格式。 图片像素不能小于 128*128,且比例需要小于1:4或者4:1,且大小不超过50M。 |
Subjects voice_id | 可选 | String | |
Audio | 可选 | Boolean | 仅上传主体时支持此功能。 是否使用音视频直出能力。 可选值:true、false,默认 false。 true:使用音视频直出能力。 false:不使用音视频直出能力。 选择音频直出时会多扣1.5积分。 |
Bgm | 可选 | Boolean | 仅上传图片(非主体调用)支持此功能。 是否为生成的视频添加背景音乐。 可选值:true 、false,默认:false。 传 true 时系统将从预设 BGM 库中自动挑选合适的音乐并添加;不传或为 false 则不添加 BGM。 BGM 不限制时长,系统根据视频时长自动适配。 |
Images.N | 是 | Array of String | 图像参考。 支持上传1~7张图片,模型将以此参数中传入的图片中的主题为参考生成具备主体一致的视频。 支持传入图片 Base64 编码或图片 URL(确保可访问)。 图片支持 png、jpeg、jpg、webp 格式。 图片像素不能小于 128*128,且比例需要小于1:4或者4:1,且大小不超过10M。 示例值:["https://\\**.jpg"] 注意: base64 编码后会扩大30%,实际 decode 后的图片大小限制为7M。 |
Duration | 否 | Integer | 视频时长参数。 可选值:1-10(整数),默认5秒。 示例值:5 |
AspectRatio | 否 | String | 比例。 可选值:16:9、9:16、4:3、3:4、1:1,默认 16:9。 示例值:16:9 |
Resolution | 否 | String | 分辨率参数。 可选值:540p、720p、1080p,默认 720p。 示例值:720p |
三. Kling
文生视频
参数名称 | 必选 | 类型 | 描述 |
NegativePrompt | 否 | String | 负向文本提示词,不能超过2500个字符。 示例值:模糊 |
Duration | 否 | String | 生成视频时长,单位 s 。 可选值:3、4、5、6、7、8、9、10、11、12、13、14、15,默认5。 不同模型支持时长不同。 示例值:5 |
Mode | 否 | String | 生成视频的模式。 v1.6 模型默认值:std,标准模式。 v2.0 模型无需配置。 示例值:std |
CfgScale | 否 | Float | 生成视频的自由度;值越大,模型自由度越小,与用户输入的提示词相关性越强。 取值范围:[0, 1],默认值:0.5。 示例值:0.5 |
AspectRatio | 否 | String | 生成视频的画面纵横比(宽:高)。 可选值:16:9, 9:16, 1:1,默认值:16:9。 示例值:16:9 |
图生视频
参数名称 | 必选 | 类型 | 描述 |
Image | 否 | String | 参考图像。 支持传入图片 Base64 编码或图片 URL(确保可访问)。 图片文件大小不能超过10MB,图片分辨率不小于300*300px,图片宽高比要在1:2.5 ~ 2.5:1之间。 Image 参数与 ImageTail 参数至少二选一,二者不能同时为空。 |
ImageTail | 否 | String | 参考尾帧图像。 支持传入图片 Base64 编码或图片 URL(确保可访问)。 图片文件大小不能超过10MB,图片分辨率不小于300*300px,图片宽高比要在1:2.5 ~ 2.5:1之间。 Image 参数与 ImageTail 参数至少二选一,二者不能同时为空。 |
NegativePrompt | 否 | String | 负向文本提示词,不能超过2500个字符。 示例值:模糊 |
Duration | 否 | String | 生成视频时长,单位 s 。 可选值:3、4、5、6、7、8、9、10、11、12、13、14、15,默认5。 不同模型支持时长不同。 示例值:5 |
Mode | 否 | String | 生成视频的模式。 枚举值:std,pro。 其中 std :标准模式(标准),基础模式,性价比高。 其中 pro :专家模式(高品质),高表现模式,生成视频质量更佳。 示例值:std |
CfgScale | 否 | Float | 生成视频的自由度;值越大,模型自由度越小,与用户输入的提示词相关性越强。 取值范围:[0, 1] 示例值:0.5 |
Sound | 否 | String | 生成视频时是否同时生成声音。 可选值:on、off。 仅V2.6及后续版本模型支持当前参数。 示例值:off |
可灵O1
参数名称 | 必选 | 类型 | 描述 |
ImageList.N | Array of ImageInfo | 否 | 参考图列表。 包括主体、场景、风格等参考图片,也可作为首帧或尾帧生成视频;当作为首帧或尾帧生成视频时,通过 type参数来定义图片是否为首尾帧:first_frame 为首帧,end_frame 为尾帧。 暂时不支持仅尾帧,即有尾帧图时必须有首帧图。 首帧或首尾帧生视频时,不能使用视频编辑功能。 用 key:value 承载,如下: "ImageInfo":[{"ImageUrl":"https://cos.ap-guangzhou.myqcloud.com/test.png","Type":"first_frame"},{"ImageUrl":"https://cos.ap-guangzhou.myqcloud.com/test.png","Type":"end_frame"}]支持传入图片 URL(确保可访问) 图片支持 jpg、jpeg 、png 格式。 图片文件大小不能超过10 MB,图片宽高尺寸不小于300 px,不大于8000 px,图片宽高比要在1:2.5~2.5:1之间 有参考视频时,参考图片数量不得超过4;无参考视频时,参考图片数量不得超过7。 数组中超过2张图片时,不支持设置尾帧。 |
AspectRatio | String | 否 | 生成视频的画面纵横比(宽:高)。 枚举值:16:9, 9:16, 1:1。 未使用首帧参考或视频编辑功能时,当前参数必填。 示例值:16:9 |
Duration | Integer | 否 | 生成视频时长,单位s。 可选值:3、4、5、6、7、8、9、10、11、12、13、14、15,默认5。 不同模型支持时长不同。 示例值:5 |
Mode | String | 否 | 生成视频的模式。 枚举值:std,pro。 其中std:标准模式(标准),基础模式,性价比高。 其中pro:专家模式(高品质),高表现模式,生成视频质量更佳。 示例值:pro |
VideoList.N | Array of ReferVideoInfo | 否 | 参考视频,通过URL方式获取。 可作为特征参考视频,也可作为待编辑视频,默认为待编辑视频;可选择性保留视频原声。 通过 ReferType 参数区分参考视频类型:feature 为特征参考视频,base 为待编辑视频。 参考视频为待编辑视频时,不能定义视频首尾帧。 通过 KeepOriginalSound 参数选择是否保留视频原声,yes 为保留,no 为不保留;当前参数对特征参考视频(feature)也生效。 视频格式仅支持 MP4/MOV 。 仅支持时长≥3秒且≤10秒的视频。 视频宽高尺寸需介于720px(含)和2160px(含)之间。 视频帧率基于24fps~60fps ,生成视频时会输出为24fps 。 至多仅支持上传1段视频,视频大小不超过200MB 。 |