接口对接常见问题

最近更新时间:2025-07-11 18:41:12

我的收藏

调用接口时出现鉴权不通过?

1. 确认签名时参数按照字典序排列了。
2. 确认时间戳参数为当前时间。
3. 参考以下示例参数,按照自己的签名步骤计算一下,如果计算结果与示例一致则表示签名计算步骤无误。
参数:
appkey = e38267c0e86411ebb02aed82acb0ed99
accesstoken = f68f2d10ae9e4604b76fb05cf46bccec
timestamp=1646636485
签名结果:BfWuaC9kmaicCggXc693uK%2BsZQ8qe88O4HVQNTdwZuo%3D

调用接口出现参数错误?

1. 请确认请求的 body 是否加了 header 参数,不加的话会报错。如右图所示。
2. 参数的类型要严格按照接口文档中填充。




查询出的形象数量不对或查询不到形象?

如果您开通的是小样本形象,则需要参考 分页查询小样本形象列表接口 进行查询。
如果您开通的是 2D 精品形象,则需要参考 客户资源查询主播接口 进行查询。
说明:
官网下单播报小时包后,开通的形象既有 2D 小样本,又有 2D 精品,需要参考两套接口分别查询相关形象。

是否支持生成透明背景的视频?

支持,可以生成 WebM 格式的带透明通道的视频。

为什么 WebM 透明背景的视频播放出来是绿幕的?

说明客户使用的播报器不支持 WebM 格式,可以尝试 Chrome 中进行播放,如果出来的视频是黑底的,说明视频本身没问题。

形象位置参数调整后不生效?

1. 确认调用的接口是基础版还是进阶版,只有进阶版接口支持。
2. 确认视频输出格式是否为 GreenScreenMp4,设置为该值时不支持调整位置。

主播位置计算方法?

您可以参考下图进行计算。




如何计算数智人初始大小?

数智人查询接口中会返回 OriginZoom(原始缩放系数)和 PoseImage(数智人姿态图片),OriginZoom 乘以 PoseImage 的宽高即为数智人初始大小。

文案中插入动作不生效?

动作前后需要预留一定的文字,每个动作对预留文字都不一样,建议前后预留10个字以上。

数智人是否支持调整语速,韵律,多音字?

可以,参考接口文档中的 SSML 标签 附录二: SSML 规范 部分。

指定了外部的 S3 存储,数智人视频未上传上去?

请检查 S3 的权限设置是否允许外部写入,或者参数中的 S3 链接是否带入了鉴权信息。

为什么没有字幕文件?

只有文本驱动才有字幕文件,声音驱动没有。

超过配额限制: 提交音频制作数量超过限制:1?

开通权限时默认只开通1路音频制作并发,即同时只能有一个音频任务处于制作中,必须等上一个制作完成后才能提交下一个任务。可以通过购买音频并发解决。

超过配额限制: 提交视频制作数量超过限制:n?

1. 针对每种形象类型,每个用户默认支持同时处理5个视频制作任务,由主子账号共享。这5个任务使用的并发资源所有客户共享,可能会出现任务排队的情况。
2. 可增购播报独享并发,例如购买了1路播报独享并发,则一共支持同时处理6个视频制作任务。增购的并发由该用户专享。
解决方案:
1. 用户增加任务排队策略。
2. 购买独享并发。

视频制作接口-视频免训练中的 VideoParametersConsistent 参数,选强制对齐和不强制对齐,对生成时间有什么影响吗,具体影响分别是什么?

这里指输出视频帧率码率跟输入视频是否进行对齐。
码率对齐的影响10%左右;帧率影响会大一些,例如25帧到60帧,大概+30%。

视频制作接口-视频免训练中的 VideoLoop 参数,反向拼接和正向拼接的含义是什么,是否有示例?

视频的正反向拼接,主要在音频时长大于视频时长时会用到。
假设输入音频2秒,视频1秒。
正向拼接:2个1秒视频直接拼接,可能会出现跳帧的情况,第一秒最后一帧和第二秒第一帧大概率不一致。
反向拼接:1秒视频先正放再倒放。

视频制作接口-视频免训练生成的形象有哪些音色可选择?

请参考 音色列表 中音色类型为“精品音色”的音色清单。
您可以在 音色试听 进行试听。