形象录制指引-播报场景

最近更新时间:2026-03-27 16:13:11

我的收藏
在播报场景中,录制素视频材的核心在于确保人物的肢体动作自然、贴切,与播报内容、语言节奏及场景匹配,而提升产品宣传、知识口播等实际应用中的真实感与专业度。



一、专属口型

定制素材要求

形象定制需提交一段 30s 以上的真人口播视频。拍摄指引见附录:

视频格式要求:
1. 视频大小不超过5GB,时长不短于30s、不长于10分钟。
2. 视频格式为 mp4、mov。
3. 视频分辨率1080P、4K(3840*2160),宽高比符合16:9 (9:16)。
4. 视频帧率不低于25fps、不高于60fps。
5. 视频里的人物的头部需朝上,若人物横置则需要进行旋转调整。

二、通用口型

AI 生成

您可以通过 AI 生成技术快速生成一段约一分钟的人物视频,在数智人平台上训练和使用,整个过程无需专业拍摄设备、演员和复杂后期,与真人实拍相比,制作周期大幅缩短,综合成本显著降低,助力您高效实现内容产出。
当前通用口型租赁形象库已整合了数十个 AI 模特资源,可供您参考。


真人拍摄

整体录制要求同专属口型:
通用口型在素材格式上,和专属口型相比,仅有如下两点差异:
1. 视频时长不短于5s、不长于10分钟。
2. 环境声音:无需收音,模特全程可自然闭嘴。

三、高精版本

整体录制要求同专属口型:
高精版本在素材格式上,和专属口型相比,仅有如下两点差异:
1. 视频大小不超过10GB;
2. 视频分辨率需为4K(3840*2160),宽高比符合16:9 (9:16)

附录

1. 拍摄指引(视频版)

1.1 实景或白幕背景拍摄指引



1.2 绿幕背景拍摄指引



2. 拍摄指引(文字版)

拍摄场地布置

2.1 场地选择

注意:
如有后期有换背景需求可使用绿幕或白幕拍摄;如对固定背景有诉求可选择适宜的环境进行实景拍摄,后续生成的视频均会保留此背景。
实景拍摄:请选择光线稳定充分,安静无杂音的实景房间录制。(实景拍摄即固定背景,后期不支持更换其他背景;室外拍摄需要佩戴麦克风,保证声音清晰无噪音)
绿幕拍摄:请选择光线稳定充分,安静无杂音的绿幕房间录制。
白幕拍摄:请选择光线稳定充分,安静无杂音的白墙 or 白幕房间录制。(白幕拍摄暂不支持带桌椅拍摄)

2.2 模特服装造型选择

模特:五官端正、有颜值、有⽓质、说话口齿清晰、表演⾃然、优先上镜经验丰富的模特。
服装:
实景拍摄:对服装颜色无要求;
绿幕拍摄:不要选择反光材质/格子条纹的服装;不要选择绿色的相近色服装(如黄色、绿色、黄绿色),以免影响抠图效果。
白幕拍摄:避免穿白色系服装;白色衣服如果不在身体边缘(例如西装内搭),则可以穿着。
发型:发型规整, 避免明显发缝、碎发;避免佩戴会晃动的耳坠。(仅针对绿幕拍摄和白幕拍摄的素材有此要求,实景拍摄无此限制)
实景拍摄示例:

绿幕拍摄示例:

白幕拍摄示例:


2.3 拍摄设备和布光

拍摄过程画面稳定不抖动,录制过程中光线不发生显著的变化。
拍摄画面分辨率在 1080p 及以上,不要开启 HDR 录制模式。
绿幕/白幕平整无褶皱,铺满画面。



2.4 手机拍摄标准

手机设备首选苹果手机,拍摄时具体参数如下:后置摄像头拍摄、视频模式(非电影效果),大小1x,分辨率4K,帧率30fps;关闭 PAL 格式、HDR 模式、自动 FPS,关闭入口:设置 > 相机 > 录制视频。
具体设置如下图所示:




3. 拍摄录制

3.1 视频录制站位





3.2 拍摄监测实时预览

可通过 obs 等软件实时预览抠图效果,可前置发现配饰反光、面部&服装反绿光等情况,在拍摄现场可实时调整拍摄方案,避免反复录制耽误定制的进度。

3.3 拍摄录制(需同期收音)

景别选择:若最终生成的视频用于竖屏场景,建议使用竖屏拍摄;横屏同理。当全身出镜时,确认人像尽量大,手部动作不要出画面。
录制过程:
1. 启动录制后, 模特先闭口1-3秒, 保持姿态不动。
2. 接下来, 模特自然说话 30s 以上;避免相同文案不断重复;说话过程可以自然小幅动作, 眼睛不要斜视、需正视摄像头。
3. 说话结束后,停止录制。
动作建议:说话时双手可以做一些中性百搭的动作,不会做动作的可以双手交叉放在身前。注意手势幅度要小、频率要低,轻柔匀速,不要遮挡脖子和面部;手势避免有语义或者指向性,需适配所有的文本。(如果该数智人最终用于实时交互场景,则对手部动作有额外的要求,详见该页面第五部分)

4. 后期处理

4.1 剪辑

掐头去尾,去掉开头、结尾多余画⾯。
剪辑⼯程的帧速率设置须和拍摄的素材帧速率保持⼀致,避免声画⼝型不对位。

4.2 调⾊及美颜

修复画⾯瑕疵,确保模特颜值在线,但要保留模特⽪肤质感,不能太⽩、太平。

4.3 调⾳

如果视频⾥的⾳频有噪⾳,需要去噪,确保声⾳质量良好,同期声清晰。

4.4 抠像

若您具有抠像能力,可以对原始视频提前进行抠像处理。根据所提供视频素材,将支持提供不同的视频输出能力。

情况一:提供经过抠像处理后的“纯绿底视频”(下图视频2),数智人侧绿底背景视频直接输出(下图视频3)
客户提供经过抠像处理后的绿底视频进行训练,数智人侧将直接使用绿底作为最终输出的视频背景,定制效率较高,交付时间短。抠像指南如下:
抠除绿布背景,去除演员⾝上绿⾊反光,记得⽤其他背景颜⾊检查是否抠⼲净,要确保能适配任何背景画面。
抠像⼲净后,背景填充纯绿⾊,#00ff00 (R:0、G:255、B:0) 。



数智人交互&播报接口里输出的视频&视频流,不支持更换背景,即:①不支持替换背景输出;②不支持输出透明背景的 webm 视频。客户拿到数智人输出的视频后,还需要在应用场景中进一步去绿处理。

情况二:提供原始拍摄视频外,额外提供 alpha 通道的视频(下图视频2),数智人侧支持背景更换输出(下图视频3)
需要同时提供“视频1:原始拍摄视频”(也可以是经过加工的视频)和“视频2:alpha通道视频”,这两个视频的分辨率、时长需要完全一致。
此情况下,数智人交互&播报接口里输出的视频&视频流,支持更换背景。