2025年9月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
数智人平台及 API 功能新增 | 平台/接口 | 2D 小样本大屏端渲染 SDK 发布,现已支持 Android 9 及以上系统,兼容瑞芯微 RK3588 等主流芯片,目前已逐步应用于教育陪练、职教考试培训等多种场景。 | 9月12日 | |
2D 精品形象升级 | 能力升级 | 2D 精品形象新增 AI 动作生成功能,原精品定制支持录制8个动作,升级 AI 方案版本支持20个动作,用户无需额外拍摄视频素材,有效降低拍摄成本和时间投入。 | 9月12日 | |
数智人视频免训练插件上线 | 能力升级 | 数智人视频免训练插件现已在 ADP 平台上线,支持在 Agent 模式应用和工作流中一键使用。 ![]() | 9月12日 |
2025年8月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
数智人平台功能新增 | 平台 | 新增 AI 标识开关:为积极响应国家关于 AI 内容标识的政策要求,平台将于9月1日正式上线 AI 标识功能,该功能默认开启,无需额外操作即可符合规范,支持用户自定义打标文案。若用户关闭 AI 标识,则需自行承担责任和义务。目前数智人平台已开启自定义打标入口。 视频打标样式: ![]() 视频生成实时率: 开启 AI 标识会对视频合成性能产生一定影响,在1080p分辨率、25fps帧率、4000kbps码率的基准条件下: 2D 通用、专属口型合成视频的实时率上浮0.1(从1:2提升至1:2.1) 2D 免训练合成视频的实时率上浮0.2(实时率范围为1:2.2~2.7)。 音频打标样式: 开启 AI 标识后,音频的最前面会采用节奏标识的形式增加显标信息,即摩斯码(嘀嘀声“短长短短”,含义为:AI)。 平台将持续优化方案,在满足合规要求的同时,最大限度保障用户体验。 | 8月12日 | |
2D 小样本训练模型升级 | 能力升级 | 本次升级对底层模型进行了深度优化,专属口型抠图效果更加自然细腻,显著提升发丝细节的处理能力,同时专属、通用口型匹配呈现更精准的效果。 ![]() 8月12日及之后,所有新训练的形象将自动采用升级版模型,历史版本也会在近期逐步完成更新,老用户可随时联系数智人技术支持团队,优先进行模型更新。 | 8月12日 |
2025年5月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
形象类型新增 2D 小样本免训练(照片素材) | 平台 | 推出 2D 小样本免训练(照片素材),无需训练只需一张照片,输入文本或音频,即可快速生成口型匹配的视频。 核心优势: 1. 效果更好:相比传统 2D 小样本照片数字人,效果优化2倍以上。人物头部、身体晃动幅度更加自然流畅。 2. 成本更低: 无训练费,仅按消耗分钟数收取小时包费用; 注: 目前仅支持播报服务,不支持交互服务。 | 5月27日 | |
2D 小样本免训练(视频素材) | 能力升级 | 1. 体验升级:视频免训练入口已在数智人平台上线; 2. 新增人脸 ID 驱动功能:支持上传人脸 ID 实现免训练视频驱动,适用于多人物视频场景(如访谈、对话场景),可精准指定目标人脸进行驱动。 3. 支持指定视频片段:支持用户从原始视频中选取指定片段,精准合成数字人驱动视频。适用于原始视频比较长,动作比较丰富的场景。 4. 支持首尾帧归位:支持生成的数字人视频首尾帧一致,用于提升多段内容拼接的自然度、避免视频拼接跳帧的问题。 5. 驱动时段定制化:可标记视频中不驱动的时段,如旁白等不需要人物张嘴的片段。 | 5月27日 | |
数智人平台及 API 功能新增 | 平台/接口 | 2D 小样本端渲染(iOS)及官网下单功能已上线。 | 5月27日 |
2025年4月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
数智人平台及 API 功能新增 | 平台/接口 | 1. 2D 小样本支持客户端渲染(安卓版),数智人形象和口型渲染可在用户终端设备上完成,支持输入文本/流式 PCM 音频,实时驱动数智人口型,适配高并发量的数智人交互场景。 2. 2D 小样本端渲染(iOS)及官网下单功能预计5月中下旬同步上线。 | 4月25日 | |
官网租赁库形象更新 | 形象库升级 | 1. 形象上新:本次新增135个海外形象,覆盖日韩、欧美、东南亚等地区,包含123个专属口型和12个通用口型。 2. 形象下架:部分旧版专属口型形象(包括语小月、柯佳、言小才、言小姵、黛亦、弘文共6个形象)因表情自然度、动作流畅性无法满足当前用户需求,目前已暂停服务,已购用户到期后不可续期。如有替代需求,我们可以为您推荐其他可用形象,感谢理解。 | 4月25日 | |
【3D 端渲染会话驱动次数包】计费规则更新 | 购买页 | 3D 端渲染场景使用必选,需要配合端渲染 SDK 使用,单包支持100万次调用,按 GBK 编码,40字节=1次(即20个汉字算1次消耗),有效期自购买之日一年内。 | 4月25日 |
2025年2月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
形象类型新增 2D 小样本免训练(视频素材) | 平台 | 推出 2D 小样本免训练(视频素材),无需训练,分钟级生成数字人。只需一段真人视频素材,输入文本或音频,即可快速生成口型匹配的新视频,省时省力。 核心优势: 1. 极速体验: 无需训练,几分钟出成品。 2. 门槛更低: 适合获客拉新、营销口播等场景。 3. 成本更低: 无训练费,可尝试多场景、多服装拍摄,丰富视频内容。 注:目前仅支持播报服务,不支持交互服务。 | 2月19日 |
2024年12月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
2D 小样本专属口型基础形象库视觉升级 | 形象库升级 | 2D 小样本专属口型基础形象库视觉升级,品质全面提升。 升级说明: 1. 现有用户: 在有效期内,您的专属口型形象将保持不变,确保体验一致性。 2. 新购/续购用户: 升级后,您将享受全新视觉效果的专属口型形象,体验更佳。 | 12月18日 |
2024年8月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
数智人平台及 API 功能新增 | 平台/接口 | 数智人播报能力的相关优化,包含: 1. 数智人平台音视频播报模块增加保存和草稿功能。 2. 播报视频新增支持输出带通道的 mov 格式,可通过数智人平台-生成视频、播报 aPaaS 指定输出格式。 3. 优化了数智人平台上对形象位置、大小缩放的限制规则,更好适配视频制作需求。 4. 新增音色筛选及搜索功能以便快速查找,同时优化了无性别音色的展示规则。 | 8月8日 | |
数智人小程序体验升级 | 能力升级 | 1. 新增支持 2D 小样本通用口型定制体验,每微信用户可免费体验1次定制,及定制形象对话&播报效果。 2. 新增支持照片数智人风格化,包含插画、国风、3D 插画等多种风格生成,敬请体验。 | 8月8日 | - |
2024年7月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
2D 小样本形象定制能力升级 | 平台/接口 | 2D 小样本数智人定制流程的优化,包含: 1. Demo 确认部分的优化:支持客户指定音色和语速定制 Demo,支持客户提前指定文案、音色及语速、音频生成 Demo;形象定制时,支持自动将视频里的音频提取出来快速复刻,生成文本驱动 Demo;支持预览全部视频片段(即带帧号的pv视频)。 2. 支持客户在定制 2D 小样本(专属口型、通用口型和高精版本)数智人时,通过接口或平台上传 alpha 通道视频制作。 3. 支持客户在定制 2D 小样本(专属口型、通用口型和高精版本)数智人时,上传白幕或白墙背景的视频,支持白幕扣图。 | 7月19日 |
2024年4月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
视频定制接口能力升级 | 接口 | 优化播报视频制作资源共享的逻辑: 1. 每种形象类型,默认支持同时处理5个视频制作任务,由主子账号共享;调用的视频制作并发资源是所有客户共享的,可能会出现任务排队的情况。 2. 客户可增购播报独享并发,详情见:购买页。例如客户购买了1路播报独享并发,则支持同时处理6个视频制作任务。 | 4月25号 | |
SDK 增加快速跑通接入方案 | 接口 | H5 SDK 增加快速跑通方案,保证接入方可以在10分钟内完成接入工作,并最终得到一个包含完备 UI 的数智人交互对话界面。 | 4月23日 | |
数智人平台功能升级 | 平台 | 支持对定制形象和复刻的声音资产在架服务的续期管理 | 4月10号 | |
声音复刻能力升级 | 平台/接口 | 新增声音复刻(极速版),包含: 1. 支持通过15秒的音频快速进行声音复刻; 2. 支持下单购买声音复刻(极速版),详见 购买页; 3. 支持通过定制接口进行声音复刻(极速版)的定制; 4. 支持在播报&交互 aPaaS 和平台上使用定制好的声音。 | 4月8号 |
2024年3月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
数智人平台V3.0.0发布 | 平台/接口 | 支持在数智人平台进行一站式大模型配置,包含: 1. 支持直接创建大模型应用、绑定同 UIN 下应用、通过 appkey 绑定应用到数智人交互项目; 2. 支持配置大模型应用,如知识管理、导入文档等; 3. 支持互动调优数智人话术。 | 3月27日 | |
数智人平台支持iPaaS模式 | 接口 | 支持 iPaaS(Integration Platform as a Service)的模式,支持快速集成配置端(数智人平台)页面并进行主题色、品牌 logo 的配置。 | 3月27日 | |
数智人小程序体验升级 | 能力升级 | 1. 可官网扫码直接体验照片数字人、2D 小样本、3D 数智人等形象类型,在大模型流式对话下驱动下的效果。 2. 每微信用户可免费体验3次照片数字人定制,及定制形象对话&播报效果。 | 3月27日 | - |
3D 形象及能力升级 | 能力升级 | 3D 形象支持使用小样本音色。 | 3月27日 | - |
2024年2月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
形象类型新增 2D 小样本(照片数字人) | 平台/接口 | 支持新产品 2D 小样本(照片数字人),包含: 1. 新增通过定制接口进行照片数字人定制; 2. 支持通过平台上传照片、查看定制进度; 3. 支持在资产管理里,查看下发的照片数字人; 4. 支持在播报&交互 aPaaS 和平台上使用照片数字人。 | 2月4日 |
2023年11月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
形象类型新增 2D 小样本(通用口型) | 平台 | 支持新产品 2D 小样本(通用口型),包含: 1. 新增通过定制接口进行数字人定制; 2. 支持通过平台上传素材、查看定制进度; 3. 支持在资产管理里,查看下发的通用口型数字人; 4. 支持在播报&交互 aPaaS 和平台上使用通用口型数字人。 | 11月2日 |
2023年10月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
数智人平台及 API 功能新增 | 平台/接口 | 1. 新增个人资产模块(含默认音色、默认语速设置)。 2. 新增新客领用流程,支持自助领用交互及播报服务体验资源。 3. 2D 小样本定制流程支持自定义文本与音频驱动 demo。 4. 支持使用腾讯云公有云音色(可调情感风格、情感程度、音量增益)。 5. 运营统计分析模块口径提示+新增会话次数相关统计。 6. 扩充了音频驱动/定制音频素材时,支持的音频格式均由 wav、mp3 扩展到 wav、mp3、wma、m4a、aac 5种格式。 | 10月26日 | |
3D形象及能力升级 | 能力升级 | 1. 标准形象库扩充,新增S级写实形象呦呦2.0、A级半写实形象艾云、B级卡通形象叮当。 2. 3D 驱动路线升级,口型驱动效果提升。 3. 新增表情能力,支持平台插入表情,提升形象表情表现力。 4. 动作制作方案优化,静默动作自然度提升,增加自然头部和身体晃动,动作中支持丰富表情表现。 | 10月27日 |
2023年7月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
播报 aPaaS V4.8.5发布 | 接口 | 1. 支持更长的原始视频素材片段,用于最终数智人生成视频服务。 2. 播报视频可以通过 aPaaS 接口指定首尾帧。 3. 音频驱动场景下,可以通过 aPaaS 接口支持首尾帧归位。 4. 资产管理 API 接口支持查询“带帧号的闭嘴视频片段”,便于选择合适的帧号。 | 7月29日 |
2023年6月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
小样本形象定制接口V1.2.0发布 | 接口 | 支持通过接口查询形象定制全流程状态。 | 6月20日 |
2023年4月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
小样本形象定制接口V1.1.0发布 | 接口 | 支持通过 API 接口上传形象定制素材和声音定制素材。 | 4月25日 |
2023年2月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关链接 |
数智人平台发布 | 平台 | 1. 融合播报平台和交互平台。 2. 标准形象库支持平台预览。 | 2月8日 |
2023年1月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关链接 |
播报平台能力更新 | 平台 | 1. 形象新增,支持小样本数智人。 2. 上线原声驱动的功能。 3. 支持制作、下载和删除音频文件。 4. 支持带 alpha 通道透底视频生成,格式为 webm。 | 1月3日 | - |
2022年12月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关链接 |
交互数智人V1.7.0 | 平台 | 1. 并发数和形象绑定。 2. 支持给形象进行声音驱动的单独授权。 3. 给主账号授权交互体验优化 | 12月5日 |
2022年11月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关链接 |
交互数智人V1.6.0 | 平台 | 1. 功能新增,交互数人与渲染小程序插件接入上线,针对话术。100%固定的场景可使用该小程序插件,提升并发。 2. 交互数智人云端预渲染方案上线。 3. 首页增加视频流实时预览功能,降低用户接入验证成本。 4. 小程序扫码体验:二维码延长生效时间至2小时、且共享数智人项目的并发,提升 POC 的体验。 5. 入库方式体验优化:话术内容自动添加,提升用户体验 6. 话术管理页面添加“累计调用次数”、“渲染情况”等新的字段 7. 话术管理兼容文本客服配置的富文本样式 | 11月9日 |
2022年10月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关链接 |
购买页发布 | 购买页 | 支持线上下单购买产品。 | 10月26日 |
2022年9月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关链接 |
交互数智人V1.5.0 | 平台 | 1. 【形象升级】2D 真人形象驱动模型升级,提升形象的自然度、美白度和清晰度。 2. 【功能新增】2D/3D 数字人增加声音驱动能力。 3. 【音色上新】新增音色。 4. 【体验优化】形象切换时,话术管理部分的优化。 5. 【体验优化】提示文案优化。 | 9月12日 | - |
2022年8月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关链接 |
播报aPaaS接口V4.0.0 | 接口 | 1. 【3D 形象上线】接口新增 3D 形象,包含呦呦5套服装,同交互平台。 2. 【2D 形象扩充】新增多个 2D 形象。 3. 【功能扩充】播报接口功能扩充。 4. 【效率提升】透明背景制作效率提升。 5. 【配置优化】播报接口权限管理逻辑优化。 | 8月5日 | - |
播报平台 | 平台 | 1. 【平台更名】更名为“腾讯云-播报数智人平台”。 2. 【音色切换】支持音色切换。 3. 【内容编辑】支持文本、TTS 标注及动作标注。 4. 【视频设置】支持视频不同的分辨率、比例;支持上传片头片尾 | 8月11日 | - |
交互数智人V1.4.0 | 平台 | 1. 【能力新增】上线7个新的高自然度音色;可试听语速。 2. 【对接对话】文本客服页面的嵌入,可直接在交互数智人里配置对话。 3. 【对接对话】可绑定任意客服机器人的对话(非本人账号创建的也可以)。 4. 【话术增强】话术管理页面优化:3D 增加智能动作匹配&批量导入回复语。 5. 【话术增强】不使用云小微对话服务的 bot,也可以使用话术管理,进行动作&语音&样式标注干预。 6. 【组件化】组件化能力:面向三方平台提供组件化输出能力;面向内部平台提供基于权限底座的组件化输出能力。 7. 【功能新增】形象融合部分能单独分配权限;存量的账号默认不勾。 8. 【体验优化】优化扫码体验的二维码的体验。 | 8月10日 |
2022年7月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关链接 |
交互数智人V1.3.0 | 平台 | 1. 【对接对话】平台上支持绑定对话,且支持实时扫码体验带对话的数智人效果。 2. 【话术增强】支持基于对话回复语进行语音&动作标注,且支持实时的效果预览。 3. 【话术增强】支持基于对话回复语,进行选择题、图片等特殊样式配置。 4. 【声音驱动】雅妮声音驱动模型上线平台,且增加声音驱动能力的扫码体验。 5. 【类型增加】增加 2D 卡通类型,支持用户选择形象,且在平台上配置动作组。 6. 【形象上架】上架6个含动作的云萱(原静萱)文本驱动形象;和2个雅妮声音驱动的形象。 7. 【体验优化】增加屏幕自适应、扫码体验优化等若干体验升级。 | 7月4日 | - |
2022年6月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关链接 |
交互数智人V1.2.1 | 平台 | 1.【配置端】完成对接云小微权限底座,平台可支持对客开通体验。 2.【配置端】支持客户通过平台创建多个数智人 bot,灵活分配并发 。 3.【接入端】支持客户自助在平台上获取接口 Key,无需线下提供。 4.【形象范围】客户体验的形象数量范围,由全量变成可灵活控制。 | 6月8日 | - |
播报数智人 aPaaS | 接口 | 支持 webm 格式透明背景、动作标签、TTS 试听(MP3 格式)、字幕文件下载(SRT 格式)、全局语速调整、多音字标注、数字标注、连读/停顿设置等数智人核心能力。 | 6月27日 | - |
2022年5月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关链接 |
交互数智人 V1.0.0 | 平台 | 1. 新增管理端配置平台: 可视化操作:可直接在配置平台上切换形象、修改背景等,操作便捷高效;配置好的内容,支持实时扫码体验。 接口升级:由原来单独提供 API 接口,升级为提供“配置平台 + aPaaS 接口”;在平台上完成配置修改后,在 aPaaS 接口可实时生效。 页面组件化:配置端具有以前端组件形式被集成到业务系统的能力。 2. 新增形象库中的数智人形象。 | 5月17日 | - |


