腾讯云智能数智人产品动态

2026年03月
动态名称
分类
动态详情
发布时间
相关文档
2D 云渲染方案
能力升级
GPU 版本文本驱动/音频驱动支持打断功能：用户可通过设置打断参数，在数字人播报过程中，随时暂停当前内容并插入新播报，适用于教育、直播等实时互动场景中即时响应提问，提升对话流畅度与用户体验。
3月11日
﻿云渲染 Android SDK 接口说明﻿
新增 PPT 模式
接口
支持通过 API 一键将 PPT 转化为数智人讲解视频，仅需上传文件并配置每页播报文案，系统将自动完成语音合成、数智人出镜与视频渲染，快速批量生成培训课件、产品介绍等各类专业视频内容。
3月31日
﻿视频制作接口- PPT 模式﻿
视频免训练升级
接口
人脸 ID 定位准确度提升：针对漫剧人脸相似度高导致的 ID 定位问题，现支持传入同一人物的多张参考图（如三视图）进行综合定位，有效提升识别准确率。
3月31日
﻿
﻿视频免训练制作接口﻿
﻿
﻿
2026年01月
动态名称
分类
动态详情
发布时间
相关文档
2D 小样本免训练（视频素材）
能力升级
针对消耗小时包的用户，我们升级了制作数智人视频的时长限制：
视频时长和驱动音频时长，从原来的10分钟提升到20分钟，满足时间更长的创作需求。
1月30日
﻿视频免训练接口﻿
2D 精品
接口升级
2D 精品交互数智人新增音频插入动作功能，可直接实现音频关联数智人动作的配置。
1月30日
﻿音频驱动指令﻿
数智人 TTS
服务升级
支持在第三方音色中配置 Minimax 服务。需先在 Minimax 购买对应服务，将其密钥录入数智人平台，即可在制作数智人视频时选用 Minimax 音色。
1月30日
﻿数智人平台﻿
2D 云渲染方案
能力升级
SEI 参数透传：支持在数字人推流/拉流过程中同步透传自定义 SEI 信息，实现视频流内容与业务系统（如实时字幕、互动指令、商品信息）的实时数据联动。
1月30日
﻿云渲染会话交互﻿
﻿
﻿
透明背景大宽流支持：新增支持带 Alpha 通道（透明背景）的大宽流推流与拉流，结合专版 TRTC SDK，即可在业务端上实现透明流的效果，实现数字人与真实场景的无缝合成。
﻿
﻿
﻿
﻿
支持按资产建流：除原“项目 ID”建流方式外，新增“资产 ID”建流接口，减少在平台上操作的环节，便于快速切换不同的数字人形象建流，提升调用效率。
﻿
﻿
﻿
﻿
开放 TRTC 参数配置：允许客户传入自有 TRTC 服务的 AppID、房间号等参数，便于复用企业现有音视频架构，降低系统耦合度。
﻿
﻿
﻿
﻿
GPU/CPU 功能同步：GPU 与 CPU 推理方案已全面支持上述全部能力，用户可根据性能需求、成本预算灵活选择技术方案，实现平滑切换与体验一致。
﻿
﻿
2025年12月
动态名称
分类
动态详情
发布时间
相关文档
2D 小样本免训练（视频素材）
能力升级
为适配多元化形象，视频免训练新增口型模式选择【柔和/夸张口型】，您可依据视频风格与表达需求，调节数字人的口型幅度。
柔和口型：效果自然真实，为默认选项。
夸张口型：口型开合幅度更显著，适合欧美风格表达或需要强化口型表现力的视频场景，使表达更具张力与感染力。
12月22日
﻿视频免训练接口﻿
2D 端渲染方案
能力升级
1. 端云切换 Demo 开箱即用：优化后的端云切换 APK ，无需任何额外开发对接，即可直接在安卓设备上实现端侧与云侧能力的流畅切换，帮助您更直观快捷地进行方案评估与效果测试。
2.  端渲染项目支持大模型服务：在创建 2D 小样本端渲染项目时，您可选择接入并使用大模型服务。
12月22日
﻿端云混合渲染方案﻿
2D 专属口型基础形象库-视觉升级
形象库升级
2D 专属租赁形象库【外模形象】将于2025年12月30日完成视觉焕新升级。届时，所有新购或续购用户，均可享受优化升级后的视觉呈现效果。
12月22日
﻿专属口型形象租赁购买页﻿
数智人平台及 API 功能新增
平台/接口
 视频免训练/照片免训练接口新增第三方存储地址参数（VideoStorageS3Url）。训练完成的视频可直接上传至用户指定的存储位置，简化客户的下载与分发流程。
12月23日
﻿视频免训练/照片免训练﻿
﻿
﻿
查询形象资产信息接口，现支持获取主播的性别属性（参数 Gender），便于用户更精细地管理与调用数字人资源。
12月23日
﻿查询形象资产信息接口﻿
﻿
﻿
云渲染 Android SDK 能力扩展：支持透出 SEI 参数信息，并可对接新版 TRTC SDK 实现输出透明底视频流，为用户在直播、实时互动等场景中提供更大的发挥空间。
12月23日
﻿云渲染 Android SDK﻿
2025年11月
动态名称
分类
动态详情
发布时间
相关文档
2D 小样本免训练（照片素材）
能力升级
1. 支持输入 prompt 控制手部动作。
2. 支持卡通人物、卡通动物等多种主体。
11月21日
﻿照片免训练接口﻿
2D 端云混合方案
能力升级
为解决纯端渲染对设备性能的依赖，数智人推出端云混合方案。当终端设备性能不足时，系统可无缝调用云端 CPU 进行推理，确保低端设备也能获得流畅的数字人交互体验。
11月21日
﻿端云混合渲染方案﻿
2D 精品形象升级
能力升级
1. 2D 精品形象支持智能动作：在"文本/音频"驱动播报或交互时，系统可自动为 2D 精品形象匹配契合的智能动作​​。无需进行任何手动配置，即可呈现自然得体的肢体语言，表现力与生动性大幅提升。
2. iPaaS 高级版增加 2D 精品形象：支持在音频上拖入动作，大幅提升视频合成效率；
3.  定制流程优化：新增线上下单、线上验收模式，合作流程更便捷。（素材仍线下提供）
11月21日
﻿精品定制指引﻿
﻿
2025年10月
动态名称
分类
动态详情
发布时间
相关文档
数智人平台及 API 功能新增
能力升级
2D 小样本大屏端渲染支持全流程自动化交付：
1. 自助授权：“按应用”与“按设备”两种授权资源包，支持在线下单、自动获取 License、自助下载 SDK 。
2. 自助定制：支持在平台自助完成端渲染形象训练，并自助下载形象模型包。
3. 免费互转：已购买端渲染资源包的用户，新老形象均可享受“云渲染”与“端渲染”免费互转升级权益（6个月内）。
10月22日
﻿2D 端渲染 SDK﻿
2D 精品形象升级
能力升级
2D 精品形象支持智能动作：在文本驱动播报或交互时，系统可自动为 2D 精品形象匹配契合的智能动作​​。无需进行任何手动配置，即可呈现自然得体的肢体语言，表现力与生动性大幅提升。
10月22日
﻿形象定制指引﻿
﻿
2025年09月
动态名称
分类
动态详情
发布时间
相关文档
数智人平台及 API 功能新增
平台/接口
2D 小样本大屏端渲染 SDK 发布，现已支持 Android 9 及以上系统，兼容瑞芯微 RK3588 等主流芯片，目前已逐步应用于教育陪练、职教考试培训等多种场景。
9月12日
﻿2D 端渲染 SDK﻿
2D 精品形象升级
能力升级
2D 精品形象新增 AI 动作生成功能，原精品定制支持录制8个动作，升级 AI 方案版本支持20个动作，用户无需额外拍摄视频素材，有效降低拍摄成本和时间投入。
9月12日
﻿形象定制指引﻿
数智人视频免训练插件上线
能力升级
数智人视频免训练插件现已在 ADP 平台上线，支持在 Agent 模式应用和工作流中一键使用。
﻿
9月12日
﻿ADP 体验链接﻿
2D 小样本免训练（视频素材）
能力升级
1. 遮挡口型优化：大幅提升存在遮挡物时的口型驱动效果，有效避免遮挡物穿模与变形。
使用方式：须将“遮挡检测开关”设置为“关闭”，系统将无视遮挡物持续驱动口型，同时确保画面自然。
﻿
2. 侧脸口型优化：支持左右45°、上下30°侧脸角度下的口型驱动。左右侧脸超过45°时，口型保持自然不扭曲，且不驱动。
﻿
3. 平台免训练功能升级：PaaS 平台上新增“指定人脸 ID”、“视频片段选择”及“自定义起始帧”三大功能，操作更灵活。
9月29日
﻿视频免训练﻿
数智人 TTS
能力升级
﻿
1. 支持接入第三方 TTS ：新增对第三方 TTS 服务支持，现可便捷接入三方语音合成引擎，丰富音色选择。  
国内站：已接入腾讯公有云 TTS ，支持调用其超自然音色、大模型音色等优质音色。
国际站：同步支持微软 Azure TTS 与 Google Cloud TTS。
2. 数智人 PaaS 平台音色选择体验优化：简化 TTS 音色的试听与选择流程，新增一键试听功能，帮助用户快速筛选出最满意的音色。
9月29日
﻿播报数智人﻿
2025年08月
动态名称
分类
动态详情
发布时间
相关文档
数智人平台功能新增
平台
新增 AI 标识开关：为积极响应国家关于 AI 内容标识的政策要求，平台将于9月1日正式上线 AI 标识功能，该功能默认开启，无需额外操作即可符合规范，支持用户自定义打标文案。若用户关闭 AI 标识，则需自行承担责任和义务。目前数智人平台已开启自定义打标入口。
视频打标样式：
﻿
视频生成实时率：
开启 AI 标识会对视频合成性能产生一定影响，在1080p 分辨率、25fps帧率、4000kbps 码率的基准条件下：
2D 通用、专属口型合成视频的实时率上浮0.1（从1:2提升至1:2.1）
2D 免训练合成视频的实时率上浮0.2（实时率范围为1:2.2~2.7）。
音频打标样式：
开启 AI 标识后，音频的最前面会采用节奏标识的形式增加显标信息，即摩斯码（嘀嘀声“短长短短”，含义为：AI ）。
平台将持续优化方案，在满足合规要求的同时，最大限度保障用户体验。
8月12日
﻿AI 标识开关操作指引﻿
2D 小样本训练模型升级
能力升级
本次升级对底层模型进行了深度优化，专属口型抠图效果更加自然细腻，显著提升发丝细节的处理能力，同时专属、通用口型匹配呈现更精准的效果。
﻿
8月12日及之后，所有新训练的形象将自动采用升级版模型，历史版本也会在近期逐步完成更新，老用户可随时联系数智人技术支持团队，优先进行模型更新。
8月12日
﻿新增定制任务﻿
2025年05月
动态名称
分类
动态详情
发布时间
相关文档
形象类型新增 2D 小样本免训练（照片素材）
平台
推出 2D 小样本免训练（照片素材），无需训练只需一张照片，输入文本或音频，即可快速生成口型匹配的视频。
核心优势：
1. 效果更好：相比传统 2D 小样本照片数字人，效果优化2倍以上。人物头部、身体晃动幅度更加自然流畅。
2. 成本更低：无训练费，仅按消耗分钟数收取小时包费用；
注： 目前仅支持播报服务，不支持交互服务。
5月27日
﻿2D 形象介绍﻿
2D 小样本免训练（视频素材）
能力升级
1. 体验升级：视频免训练入口已在数智人平台上线；
2. 新增人脸 ID 驱动功能：支持上传人脸 ID 实现免训练视频驱动，适用于多人物视频场景（如访谈、对话场景），可精准指定目标人脸进行驱动。
3. 支持指定视频片段：支持用户从原始视频中选取指定片段，精准合成数字人驱动视频。适用于原始视频比较长，动作比较丰富的场景。
4. 支持首尾帧归位：支持生成的数字人视频首尾帧一致，用于提升多段内容拼接的自然度、避免视频拼接跳帧的问题。
5. 驱动时段定制化：可标记视频中不驱动的时段，如旁白等不需要人物张嘴的片段。
5月27日
﻿免训练体验入口﻿
﻿视频免训练文档﻿
数智人平台及 API 功能新增
平台/接口
2D 小样本端渲染（iOS）及官网下单功能已上线。
5月27日
﻿2D 端渲染（iOS）SDK﻿
2025年04月
动态名称
分类
动态详情
发布时间
相关文档
数智人平台及 API 功能新增
平台/接口
1. 2D 小样本支持客户端渲染(安卓版)，数智人形象和口型渲染可在用户终端设备上完成，支持输入文本/流式 PCM 音频，实时驱动数智人口型，适配高并发量的数智人交互场景。
2. 2D 小样本端渲染（iOS）及官网下单功能预计5月中下旬同步上线。
4月25日
﻿2D 端渲染场景﻿
官网租赁库形象更新
形象库升级
1. 形象上新：本次新增135个海外形象，覆盖日韩、欧美、东南亚等地区，包含123个专属口型和12个通用口型。
2. 形象下架：部分旧版专属口型形象（包括语小月、柯佳、言小才、言小姵、黛亦、弘文共6个形象）因表情自然度、动作流畅性无法满足当前用户需求，目前已暂停服务，已购用户到期后不可续期。如有替代需求，我们可以为您推荐其他可用形象，感谢理解。
4月25日
﻿数智人购买页﻿
【3D 端渲染会话驱动次数包】计费规则更新
购买页
3D 端渲染场景使用必选，需要配合端渲染 SDK 使用，单包支持100万次调用，按 GBK 编码，40字节=1次（即20个汉字算1次消耗），有效期自购买之日一年内。
4月25日
﻿购买指引﻿
2025年02月
动态名称
分类
动态详情
发布时间
相关文档
形象类型新增 2D 小样本免训练（视频素材）
平台
推出 2D 小样本免训练（视频素材），无需训练，分钟级生成数字人。只需一段真人视频素材，输入文本或音频，即可快速生成口型匹配的新视频，省时省力。
核心优势：
1. 极速体验： 无需训练，几分钟出成品。
2. 门槛更低： 适合获客拉新、营销口播等场景。
3. 成本更低： 无训练费，可尝试多场景、多服装拍摄，丰富视频内容。
注：目前仅支持播报服务，不支持交互服务。
2月19日
﻿2D 形象介绍﻿
2024年12月
动态名称
分类
动态详情
发布时间
相关文档
2D 小样本专属口型基础形象库视觉升级
形象库升级
2D 小样本专属口型基础形象库视觉升级，品质全面提升。
升级说明：
1. 现有用户： 在有效期内，您的专属口型形象将保持不变，确保体验一致性。
2. 新购/续购用户： 升级后，您将享受全新视觉效果的专属口型形象，体验更佳。
12月18日
﻿专属口型形象租赁购买页﻿
2024年08月
动态名称
分类
动态详情
发布时间
相关文档
数智人平台及 API 功能新增
平台/接口
数智人播报能力的相关优化，包含：
1. 数智人平台音视频播报模块增加保存和草稿功能。
2. 播报视频新增支持输出带通道的 mov 格式，可通过数智人平台-生成视频、播报 aPaaS 指定输出格式。
3. 优化了数智人平台上对形象位置、大小缩放的限制规则，更好适配视频制作需求。
4. 新增音色筛选及搜索功能以便快速查找，同时优化了无性别音色的展示规则。
8月8日
﻿视频生成服务接口文档﻿
数智人小程序体验升级
能力升级
1. 新增支持 2D 小样本通用口型定制体验，每微信用户可免费体验1次定制，及定制形象对话&播报效果。
2. 新增支持照片数智人风格化，包含插画、国风、3D 插画等多种风格生成，敬请体验。
8月8日
-
2024年07月
动态名称
分类
动态详情
发布时间
相关文档
2D 小样本形象定制能力升级
平台/接口
2D 小样本数智人定制流程的优化，包含：
1. Demo 确认部分的优化：支持客户指定音色和语速定制 Demo，支持客户提前指定文案、音色及语速、音频生成 Demo；形象定制时，支持自动将视频里的音频提取出来快速复刻，生成文本驱动 Demo；支持预览全部视频片段（即带帧号的 pv 视频）。
2. 支持客户在定制 2D 小样本（专属口型、通用口型和高精版本）数智人时，通过接口或平台上传 alpha 通道视频制作。
3. 支持客户在定制 2D 小样本（专属口型、通用口型和高精版本）数智人时，上传白幕或白墙背景的视频，支持白幕抠图。
7月19日
﻿定制资产管理﻿
﻿形象定制接口﻿
﻿形象录制指引﻿
2024年04月
动态名称
分类
动态详情
发布时间
相关文档
视频定制接口能力升级
接口
优化播报视频制作资源共享的逻辑：
1. 每种形象类型，默认支持同时处理5个视频制作任务，由主子账号共享；调用的视频制作并发资源是所有客户共享的，可能会出现任务排队的情况。
2. 客户可增购播报独享并发，详情见：购买页。例如客户购买了1路播报独享并发，则支持同时处理6个视频制作任务。
4月25日
﻿视频生成服务接口文档﻿
SDK 增加快速跑通接入方案
接口
H5 SDK 增加快速跑通方案，保证接入方可以在10分钟内完成接入工作，并最终得到一个包含完备 UI 的数智人交互对话界面。
4月23日
﻿快速跑通﻿
数智人平台功能升级
平台
支持对定制形象和复刻的声音资产在架服务的续期管理
4月10日
﻿资产续期管理﻿
声音复刻能力升级
平台/接口
新增声音复刻（极速版），包含：
1. 支持通过15秒的音频快速进行声音复刻；
2. 支持下单购买声音复刻（极速版），详见 购买页；
3. 支持通过定制接口进行声音复刻（极速版）的定制；
4. 支持在播报&交互 aPaaS 和平台上使用定制好的声音。
4月8日
﻿声音复刻录制指引﻿
﻿声音复刻（极速版）接口文档﻿
2024年03月
动态名称
分类
动态详情
发布时间
相关文档
数智人平台 V3.0.0 发布
平台/接口
支持在数智人平台进行一站式大模型配置，包含：
1. 支持直接创建大模型应用、绑定同 UIN 下应用、通过 appkey 绑定应用到数智人交互项目；
2. 支持配置大模型应用，如知识管理、导入文档等；
3. 支持互动调优数智人话术。
3月27日
﻿数智人平台操作指引﻿
数智人平台支持 iPaaS 模式
接口
支持 iPaaS（Integration Platform as a Service）的模式，支持快速集成配置端（数智人平台）页面并进行主题色、品牌 logo 的配置。
3月27日
﻿配置端 iPaaS 接入﻿
数智人小程序体验升级
能力升级
1. 可官网扫码直接体验照片数字人、2D 小样本、3D 数智人等形象类型，在大模型流式对话驱动下的效果。
2. 每微信用户可免费体验3次照片数字人定制，及定制形象对话&播报效果。
3月27日
-
3D 形象及能力升级
能力升级
3D 形象支持使用小样本音色。
3月27日
-
2024年02月
动态名称
分类
动态详情
发布时间
相关文档
形象类型新增 2D 小样本（照片数字人）
平台/接口
支持新产品 2D 小样本（照片数字人），包含：
1. 新增通过定制接口进行照片数字人定制；
2. 支持通过平台上传照片、查看定制进度；
3. 支持在资产管理里，查看下发的照片数字人；
4. 支持在播报&交互 aPaaS 和平台上使用照片数字人。
2月4日
﻿2D 小样本照片数字人操作指引﻿
﻿2D 小样本照片数字人 API 文档﻿
2023年11月
动态名称
分类
动态详情
发布时间
相关文档
形象类型新增 2D 小样本（通用口型）
平台
支持新产品 2D 小样本（通用口型），包含：
1. 新增通过定制接口进行数字人定制；
2. 支持通过平台上传素材、查看定制进度；
3. 支持在资产管理里，查看下发的通用口型数字人；
4. 支持在播报&交互 aPaaS 和平台上使用通用口型数字人。
11月2日
﻿形象录制指引-播报场景﻿
2023年10月
动态名称
分类
动态详情
发布时间
相关文档
数智人平台及 API 功能新增
平台/接口
1. 新增个人资产模块（含默认音色、默认语速设置）。
2. 新增新客领用流程，支持自助领用交互及播报服务体验资源。
3. 2D 小样本定制流程支持自定义文本与音频驱动 demo。
4. 支持使用腾讯云公有云音色（可调情感风格、情感程度、音量增益）。
5. 运营统计分析模块口径提示+新增会话次数相关统计。
6. 扩充了音频驱动/定制音频素材时，支持的音频格式均由 wav、mp3 扩展到 wav、mp3、wma、m4a、aac 5种格式。
10月26日
﻿数智人平台﻿
3D 形象及能力升级
能力升级
1. 标准形象库扩充，新增 S 级写实形象呦呦2.0、A 级半写实形象艾云、B 级卡通形象叮当。
2. 3D 驱动路线升级，口型驱动效果提升。
3. 新增表情能力，支持平台插入表情，提升形象表情表现力。
4. 动作制作方案优化，静默动作自然度提升，增加自然头部和身体晃动，动作中支持丰富表情表现。
10月27日
﻿3D 基础形象库﻿
2023年07月
动态名称
分类
动态详情
发布时间
相关文档
播报 aPaaS V4.8.5发布
接口
1. 支持更长的原始视频素材片段，用于最终数智人生成视频服务。
2. 播报视频可以通过 aPaaS 接口指定首尾帧。
3. 音频驱动场景下，可以通过 aPaaS 接口支持首尾帧归位。
4. 资产管理 API 接口支持查询“带帧号的闭嘴视频片段”，便于选择合适的帧号。
7月29日
﻿视频生成服务 API 文档﻿
﻿个人资产管理 API 文档-v1.0.9﻿
2023年06月
动态名称
分类
动态详情
发布时间
相关文档
小样本形象定制接口 V1.2.0发布
接口
支持通过接口查询形象定制全流程状态。
6月20日
﻿2D 真人小样本形象定制 API 文档-v0.1.0﻿
2023年04月
动态名称
分类
动态详情
发布时间
相关文档
小样本形象定制接口 V1.1.0发布
接口
支持通过 API 接口上传形象定制素材和声音定制素材。
4月25日
﻿2D 真人小样本形象定制 API 文档-v0.1.0﻿
2023年02月
动态名称
分类
动态详情
发布时间
相关链接
数智人平台发布
平台
1. 融合播报平台和交互平台。
2. 标准形象库支持平台预览。
2月8日
﻿数智人平台﻿
2023年01月
动态名称
分类
动态详情
发布时间
相关链接
播报平台能力更新
平台
1. 形象新增，支持小样本数智人。
2. 上线原声驱动的功能。
3. 支持制作、下载和删除音频文件。
4. 支持带 alpha 通道透底视频生成，格式为 webm。
1月3日
-
2022年12月
动态名称
分类
动态详情
发布时间
相关链接
交互数智人 V1.7.0
平台
1. 并发数和形象绑定。
2. 支持给形象进行声音驱动的单独授权。
3. 给主账号授权交互体验优化
12月5日
﻿数智人平台﻿
2022年11月
动态名称
分类
动态详情
发布时间
相关链接
交互数智人 V1.6.0
平台
1. 功能新增，交互数智人与渲染小程序插件接入上线，针对话术。100%固定的场景可使用该小程序插件，提升并发。
2. 交互数智人云端预渲染方案上线。
3. 首页增加视频流实时预览功能，降低用户接入验证成本。
4. 小程序扫码体验：二维码延长生效时间至2小时、且共享数智人项目的并发，提升 POC 的体验。
5. 入库方式体验优化：话术内容自动添加，提升用户体验
6. 话术管理页面添加“累计调用次数”、“渲染情况”等新的字段
7. 话术管理兼容文本客服配置的富文本样式
11月9日
﻿数智人平台﻿
2022年10月
动态名称
分类
动态详情
发布时间
相关链接
购买页发布
购买页
支持线上下单购买产品。
10月26日
﻿产品购买页﻿
2022年09月
动态名称
分类
动态详情
发布时间
相关链接
交互数智人 V1.5.0
平台
1. 【形象升级】2D 真人形象驱动模型升级，提升形象的自然度、美白度和清晰度。
2. 【功能新增】2D/3D 数字人增加声音驱动能力。
3. 【音色上新】新增音色。
4. 【体验优化】形象切换时，话术管理部分的优化。
5. 【体验优化】提示文案优化。
9月12日
-
2022年08月
动态名称
分类
动态详情
发布时间
相关链接
播报 aPaaS 接口 V4.0.0
接口
1. 【3D 形象上线】接口新增 3D 形象，包含呦呦5套服装，同交互平台。
2. 【2D 形象扩充】新增多个 2D 形象。
3. 【功能扩充】播报接口功能扩充。
4. 【效率提升】透明背景制作效率提升。
5. 【配置优化】播报接口权限管理逻辑优化。
8月5日
-
播报平台
平台
1. 【平台更名】更名为“腾讯云-播报数智人平台”。
2. 【音色切换】支持音色切换。
3. 【内容编辑】支持文本、TTS 标注及动作标注。
4. 【视频设置】支持视频的不同分辨率、比例；支持上传片头片尾
8月11日
-
交互数智人 V1.4.0
平台
1. 【能力新增】上线7个新的高自然度音色；可试听语速。
2. 【对接对话】文本客服页面的嵌入，可直接在交互数智人里配置对话。
3. 【对接对话】可绑定任意客服机器人的对话（非本人账号创建的也可以）。
4. 【话术增强】话术管理页面优化：3D 增加智能动作匹配&批量导入回复语。
5. 【话术增强】不使用云小微对话服务的 bot，也可以使用话术管理，进行动作&语音&样式标注干预。
6. 【组件化】组件化能力：面向三方平台提供组件化输出能力；面向内部平台提供基于权限底座的组件化输出能力。
7. 【功能新增】形象融合部分能单独分配权限；存量的账号默认不勾。
8. 【体验优化】优化扫码体验的二维码。
8月10日
﻿产品购买页﻿
2022年07月
动态名称
分类
动态详情
发布时间
相关链接
交互数智人 V1.3.0
平台
1. 【对接对话】平台上支持绑定对话，且支持实时扫码体验带对话的数智人效果。
2. 【话术增强】支持基于对话回复语进行语音&动作标注，且支持实时的效果预览。
3. 【话术增强】支持基于对话回复语，进行选择题、图片等特殊样式配置。
4. 【声音驱动】雅妮声音驱动模型上线平台，且增加声音驱动能力的扫码体验。
5. 【类型增加】增加 2D 卡通类型，支持用户选择形象，且在平台上配置动作组。
6. 【形象上架】上架6个含动作的云萱（原静萱）文本驱动形象；和2个雅妮声音驱动的形象。
7. 【体验优化】增加屏幕自适应、扫码体验优化等若干体验升级。
7月4日
-
2022年06月
动态名称
分类
动态详情
发布时间
相关链接
交互数智人 V1.2.1
平台
1.【配置端】完成对接云小微权限底座，平台可支持对客开通体验。 
2.【配置端】支持客户通过平台创建多个数智人 bot，灵活分配并发 。
3.【接入端】支持客户自助在平台上获取接口 Key，无需线下提供。 
4.【形象范围】客户体验的形象数量范围，由全量变成可灵活控制。 
6月8日
-
播报数智人 aPaaS
接口
支持 webm 格式透明背景、动作标签、TTS 试听（MP3 格式）、字幕文件下载（SRT 格式）、全局语速调整、多音字标注、数字标注、连读/停顿设置等数智人核心能力。
6月27日
-
2022年05月
动态名称
分类
动态详情
发布时间
相关链接
交互数智人 V1.0.0
平台
1. 新增管理端配置平台：
可视化操作：可直接在配置平台上切换形象、修改背景等，操作便捷高效；配置好的内容，支持实时扫码体验。
接口升级：由原来单独提供 API 接口，升级为提供“配置平台 + aPaaS 接口”；在平台上完成配置修改后，在 aPaaS 接口可实时生效。
页面组件化：配置端具有以前端组件形式被集成到业务系统的能力。
2. 新增形象库中的数智人形象。
5月17日
-
﻿
动态名称	分类	动态详情	发布时间	相关文档
2D 云渲染方案	能力升级	GPU 版本文本驱动/音频驱动支持打断功能：用户可通过设置打断参数，在数字人播报过程中，随时暂停当前内容并插入新播报，适用于教育、直播等实时互动场景中即时响应提问，提升对话流畅度与用户体验。	3月11日	云渲染 Android SDK 接口说明
新增 PPT 模式	接口	支持通过 API 一键将 PPT 转化为数智人讲解视频，仅需上传文件并配置每页播报文案，系统将自动完成语音合成、数智人出镜与视频渲染，快速批量生成培训课件、产品介绍等各类专业视频内容。	3月31日	视频制作接口- PPT 模式
视频免训练升级	接口	人脸 ID 定位准确度提升：针对漫剧人脸相似度高导致的 ID 定位问题，现支持传入同一人物的多张参考图（如三视图）进行综合定位，有效提升识别准确率。	3月31日	视频免训练制作接口
产品动态

本页目录：

2026年03月

﻿

2026年01月

﻿

2025年12月

2025年11月

﻿

2025年10月

﻿

2025年09月

2025年08月

2025年05月

2025年04月

2025年02月

2024年12月

2024年08月

2024年07月

2024年04月

2024年03月

2024年02月

2023年11月

2023年10月

2023年07月

2023年06月

2023年04月

2023年02月

2023年01月

2022年12月

2022年11月

2022年10月

2022年09月

2022年08月

2022年07月

2022年06月

2022年05月