基本结构

腾讯云智能数智人售卖三类产品:形象采购、播报服务以及交互服务。形象采购为必选项,可以搭配数智人的播报服务以及交互服务一同使用。
注意:
单独购买形象采购、播报服务以及交互服务任一产品均无法直接应用于最终的应用场景,需要组合购买。
2D/3D形象 | 形象租赁 | 支持租赁公共基础形象库内的2D、3D各类目形象;与定制二选一购买。 | | |
形象定制 | 自定义专属的数字人形象,3D需额外购买云端驱动引擎,2D不需要;与租赁二选一购买。 | | | |
定制形象续期 | 定制形象默认有1年有效期,该服务专用于定制形象到期后购买使用;租赁形象到期后,直接重新购买即可,不需要购买该续期服务。 | | | |
应用场景 | 会话互动 | 云渲染 | 通过云端服务来渲染生成形象后,将图像实时推送到终端展示。 需购买“会话互动并发数(云渲染场景)”;支持 API 和 SDK,与端渲染互斥。 | |
| | 端渲染 | 在终端本地直接渲染生成形象展示,云端只负责推送会话内容。 3D需购买“3D端渲染会话驱动次数包”和 SDK 授权 license ; 2D需购买“2D端渲染 SDK 授权年包”;支持 API 和 SDK,与云渲染互斥。 | |
| 音视频播报 | 生成视频(含音频) | 形象训练版:借助指定虚拟形象和音色,按照预设文本生成视频。 需购买“视频播报合成小时包”(含音频合成能力),需要搭配租赁形象或定制形象。 | |
| | | 形象免训练版:可以通过上传一段视频或一张照片,快速生成一段数字人视频。 需购买“视频播报合成小时包-免训练版”或“免训练并发”,此场景下无需单独购买形象。 | |
| | 仅生成音频 | 借助指定音色,按照预设文本生成音频。 需购买“音频播报合成小时包”(仅生成音频时需购买该小时包)。 | |
| | 音视频播报并发 | 通过增加并发路数来提高视频或音频的生成效率,对生成结果不影响,可选购买。 | |
声音定制 | 声音复刻 | 通过提供的声音素材,训练生成指定的音色。在应用场景中配合使用。 | | |
定制声音续期 | 复刻声音默认1年有效期,该服务专用于复刻声音到期后购买使用。 | | | |
更多服务 | ipaas 服务 | 将数智人自身平台以页面形式集成到三方系统业务或平台中,分基础版和高级版,按需购买。 | | |
2D/3D形象采购
形象租赁:通过租赁公共基础形象库内的形象。租赁期间,为无独占租赁,仅拥有该形象的使用权,该形象的所有权依旧归腾讯方所有,且腾讯方有权将该形象进行二次租赁。 适合对形象专属要求不高、业务处在初期阶段的客户。
形象定制:通过录制训练或者建模的方式对数智人形象进行定制,适用于对自有形象有要求、对形象需要拥有所有权的客户。
1. 形象租赁
形象类型 | 功能描述 | 价格 |
2D小样本通用口型 | 在2D小样本通用口型形象库中选取形象租赁,租赁期间为无独占租赁,支持文本驱动或原声驱动,基础动作按照实际形象情况为准。含默认音色。 | 50/个/月 400/个/年 |
2D小样本专属口型 | 在2D小样本专属口型形象库中选取形象租赁,租赁期间为无独占租赁,支持文本驱动或原声驱动,基础动作按照实际形象情况为准。含默认音色。 | 125/个/月 1,000/个/年 |
3D卡通 | 在3D卡通形象库中选取形象租赁,租赁期间为无独占租赁,支持文本驱动或原声驱动,基础动作按照实际形象情况为准。含默认音色。 | 18,800/个/月 150,000/个/年 |
3D半写实 | 在3D半写实形象库中选取形象租赁,租赁期间为无独占租赁,支持文本驱动或原声驱动,基础动作按照实际形象情况为准。含默认音色。 | 25,000/个/月 200,000/个/年 |
3D写实 | 在3D写实形象库中选取形象租赁,租赁期间为无独占租赁,支持文本驱动或原声驱动,基础动作按照实际形象情况为准。含默认音色。 | 37,500/个/月 300,000/个/年 |
2. 形象定制
需要注意:形象定制配额自购买后即生效,有效期为一年。
形象类型 | 功能描述 | 价格 |
2D精品 | 不限云服务、私有化使用。 支持文本/声音驱动,含1个姿态1套服装1个分辨8个基础动作,赠送默认音色1个。 录制档期1天。 | 350,000元/个 |
2D小样本通用口型 | 限云服务。支持文本及原声驱动。 通过提供1段1分钟视频素材即可定制数智人,含1个默认音色。 服装造型、姿态、动作均以视频素材数据为准。 素材为绿幕纯色背景的,方可支持背景更换功能。 | 0-20个(不含 20):2,500 元/个 20-80个(不含 80):2,000 元/个 80-200个(不含 200):1,200 元/个 200个 以上:1,000 元/个 |
2D小样本专属口型 | 支持文本驱动或原声驱动。 通过提供1段3分钟视频素材即可定制播报数智人,含1个默认音色。 服装造型、姿态、动作均以视频素材数据为准。 素材为绿幕纯色背景,方可支持背景更换功能。 | 0 - 10 个(不含 10):10,000 元/个 10 - 20 个(不含 20):8,000 元/个 20 - 50 个(不含 50):5,000 元/个 50个以上:3,000 元/个 |
2D小样本高精版本 | 支持文本驱动或原声驱动。 通过一段4K的真人视频素材进行训练数智人,素材采集要求及最终唇齿效果同2D小样本(专属口型),最终数智人的清晰度提升为4K。 | 20,000元/个 |
2D小样本照片 | 支持文本驱动或原声驱动。 通过一张照片即可训练数智人,成本低,定制速度快速。 | 19.9元/个 |
3D卡通 | 不限云服务、私有化使用。 支持文本/声音驱动/单目摄像头视频驱动,1套服装、8个动作、1个音色。 3D卡通配套资产精度为B级别。 | 300,000元/个 |
3D半写实 | 不限云服务、私有化使用。 基于“云依”身体模式定制,支持文本/声音驱动/单目摄像头视频驱动,1套服装、8个动作、1个音色。 3D半写实形象配套资产精度为A级别。 | 450,000元/个 |
3D写实 | 不限云服务、私有化使用。 支持文本/声音驱动/单目摄像头视频驱动,基于默认版3D人像(参考哟哟形象身体模板),针对脸型、发型、服装、动作按指定的要求进行客制化,成套模型包含脸型*1、发型*1、服装*1,动作库8个。 如需额外的发型、服装、动作、表情定制,需增项加购。 3D写实配套资产精度为S级别。 | 790,000元/个 |
3D写实-数字人驱动模块 | 适用于客户已有并且满足驱动规范的3D写实形象资产,支持文本驱动或原声驱动。 | 550,000元/个 |
3D半写实-数字人驱动模块 | 适用于客户已有并且满足驱动规范的3D半写实形象资产,支持文本驱动或原声驱动。 | 250,000元/个 |
3D卡通-数字人驱动模块 | 适用于客户已有并且满足驱动规范的3D卡通形象资产,支持文本驱动或原声驱动。 | 200,000元/个 |
说明:
3D形象需要额外购买数智人驱动模块搭配使用,包括:3D写实、3D半写实、3D卡通;2D形象不需要。
3. 定制形象续期
又叫定制在架服务。可用于延长定制形象的生效时间,专用于定制形象。租赁形象不适用,租赁形象通过复购方式实现续期。
形象类型 | 功能描述 | 价格 |
2D形象专属口型 | 支持对2D小样本专属口型的定制形象进行在架服务续期。 | 150元/月/个 |
2D小样本高精版本 | 支持对2D小样本高精版本的定制形象进行在架服务续期。 | 300元/月/个 |
2D形象通用口型 | 支持对2D小样本通用口型的定制形象进行在架服务续期。 | 9.9元/月/个 |
3D形象 | 支持对3D卡通、3D半写实、3D写实的定制形象进行在架服务续期。 | 600元/月/个 |
说明:
照片形象永久有效。
4. 应用场景
购买的形象主要应用场景有两个:会话互动和音视频播报;前者主要应用于实时会话交互场景,后者主要用于合成离线视频。
4.1 会话互动
交互服务是指用数智人提供语音交互的能力,具体是指支持同时在线并发交互建流的数量,常用于智能客服、数智人直播等场景。该场景下提供云渲染和端渲染两种模式。注意:交互并发根据形象类型单独提供服务,不同形象类型之间不支持混用。
云渲染模式
该模式下,只需要购买云端并发,通过 API 对接即可,如下表所示。
形象类型 | 功能描述 | 价格 |
2D精品 | 支持2D精品,分辨率最高1080p,1路1个具体形象。 | 3,500元/月/路 27,000元/年/路 |
2D小样本通用口型 | 支持2D小样本通用口型,分辨率最高1080p。 | 3,500元/月/路 27,000元/年/路 |
2D小样本专属口型 | 支持2D小样本专属口型,分辨率最高1080p。 | 3,500元/月/路 27,000元/年/路 |
2D小样本高精版本 | 支持2D小样本高精版本,分辨率最高4K。 | 6,750元/月/路 54,000元/年/路 |
2D小样本照片 | 支持2D小样本照片,分辨率最高1080p。 | 3,500元/月/路 27,000元/年/路 |
3D卡通 | 支持3D卡通,分辨率最高1080p。 | 3,500元/月/路 27,000元/年/路 |
3D半写实 | 支持3D半写实,分辨率最高1080p。 | 5,200元/月/路 41,000元/年/路 |
3D写实 | 支持3D写实,分辨率最高1080p。 | 6,750元/月/路 54,000元/年/路 |
端渲染模式
该模式下,需要搭配端渲染 SDK 进行使用。
说明:
2D和3D计费逻辑不同,请仔细核对。2D只需按年周期购买授权年包即可;3D需要同时购买授权包(永久版)和会话驱动次数包。
形象类型 | 产品内容 | 功能描述 | 价格 |
2D | 2D端渲染 SDK 授权年包 | 支持通用口型、专属口型和照片等类型数字人,不限制终端用户数量。必选。 | 800000元/年 |
3D | 3D端渲染 SDK 授权 H5 | 用于对 SDK 进行授权,购买一次,终身可用。H5 版 SDK 需要搭配 webgl 形象使用。H5 和 UE 需二选一购买。 | 200000元/年 |
| 3D端渲染 SDK 授权 UE | 用于对 SDK 进行授权,购买一次,终身可用。UE 版 SDK 主要用于 windows 系统,需要搭配 UE 形象使用。H5 和 UE 需二选一购买。 | 300000元/年 |
| 3D端渲染会话驱动次数包 | 用于统计3D端 SDK 的调用次数。单包支持100万次调用,按 GBK 编码,40字节=1次(即20个汉字算1次消耗),有效期自购买之日一年内。必选 | 10000元/年 |
4.2 音视频播报
音视频播报服务是指用数智人提供音视频播报的能力,提供如下三类资源包:
a. 视频播报合成小时包(和形象类型相关,不同形象类型不可混用),主要用于生成视频(含音频),需区分形象训练版和形象免训练版。
b. 音频播报合成小时包(通用型,与形象/音色无关,可混用)
c. 音视频播报并发(和形象类型相关,不同形象类型不可混用),主要用于提高合成视频的并发效率,需区分形象训练版和形象免训练版。
说明:
形象免训练版的并发跟3中功能不同,可以直接代替1中的合成小时包使用,即购买形象免训练版的并发后,就无需再购买对应的合成小时包。
生成视频(含音频)小时包-形象训练版,即需搭配形象使用
形象类型 | 功能描述 | 价格 |
2D精品 | 数智人定制形象视频生成时长10小时 | 0 - 10 个(不含 10):9,600 元/个 10 - 60个(不含 60):3,600 元/个 60个以上: 1,200 元/个 |
2D小样本通用口型 | 数智人租赁/定制形象视频生成时长10小时 | 0 - 10 个(不含 10): 2,000 元/个 10 - 20 个(不含 20): 1,600 元/个 20 - 50 个(不含 50):1,000 元/个 50个以上:600元/个 |
2D小样本专属口型 | 数智人租赁/定制形象视频生成时长10小时 | 0 - 10 个(不含 10): 2,000 元/个 10 - 20 个(不含 20): 1,600 元/个 20 - 50 个(不含 50):1,000 元/个 50个以上:600元/个 |
2D小样本高精版本 | 数智人定制形象视频生成时长10小时 | 0 - 10 个(不含 10): 4,000 元/个 10 - 20 个(不含 20): 3,200 元/个 20 - 50 个(不含 50):2,000 元/个 50个以上:1,200元/个 |
2D小样本照片数字人 | 数智人定制形象视频生成时长10小时 | 0 - 10 个(不含 10): 2,000 元/个 10 - 20 个(不含 20): 1,600 元/个 20 - 50 个(不含 50):1,000 元/个 50个以上:600元/个 |
3D卡通 | 数智人租赁/定制形象视频生成时长10小时 | 0 - 10 个(不含 10):9,600 元/个 10 - 60 个(不含 60):3,600 元/个 60个以上: 1,200 元/个 |
3D半写实 | 数智人租赁/定制形象视频生成时长10小时 | 0 - 10 个(不含 10):14,400 元/个 10 - 60 个(不含 60):5,400 元/个 60个以上:1,800 元/个 |
3D写实 | 数智人租赁/定制形象视频生成时长10小时 | 0 - 10 个(不含 10):19,200 元/个 10 - 60 个(不含 60):7,200 元/个 60个以上:2,400 元/个 |
说明:
默认同一个用户可同时提交5个视频制作任务,由主子账号共享,调用的并发资源是所有客户共享,可能会出现排队等待的情况。
生成视频(含音频)小时包-形象免训练版,即不搭配形象直接合成视频。
形象类型 | 功能描述 | 价格 |
2D小样本免训练(视频素材) | 视频播报合成小时包-免训练版10小时 | 5,000元/个(10小时) |
2D小样本免训练(照片素材) | 视频播报合成小时包-免训练版1小时 | 2,500元/个(1小时) |
说明:
默认同一个用户可同时提交1个视频制作任务,由主子账号共享,调用的并发资源是所有客户共享,可能会出现排队等待的情况。
免训练并发资源为独享,无需额外购买小时包;例如客户购买了2路并发,则一共可同时提交2个免训练视频制作任务。
购买的视频素材和照片素材的小时包或并发不可混用
音频播报合成小时包(即仅生成音频)
小时包类型 | 功能描述 | 价格 |
100小时包 | 限云服务,数智人租赁/复刻声音音频生成时长100小时包 | 90元/个 |
1000小时包 | 限云服务,数智人租赁/复刻声音音频生成时长1000小时包 | 750元/个 |
10000小时包 | 限云服务,数智人租赁/复刻声音音频生成时长10000小时包 | 6,500元/个 |
100000小时包 | 限云服务,数智人租赁/复刻声音音频生成时长100000小时包 | 55,000元/个 |
说明:
可选购买,只有单独生成音频时候,需要购买此小时包。
音视频播报并发
形象类型 | 功能描述 | 价格 |
2D精品 | 支持2D精品,分辨率最高1080p,1路1个具体形象。 | 3,500元/月/路 27,000元/年/路 |
2D小样本通用口型 | 支持2D小样本通用口型,分辨率最高1080p。 | 3,500元/月/路 27,000元/年/路 |
2D小样本专属口型 | 支持2D小样本专属口型,分辨率最高1080p。 | 3,500元/月/路 27,000元/年/路 |
2D小样本高精版本 | 支持2D小样本高精版本,分辨率最高4K。 | 6,750元/月/路 54,000元/年/路 |
2D小样本免训练(视频素材) | 支持2D小样本免训练(视频素材),分辨率最高1080P。注:与照片素材不可混用,可代替对应小时包 | 12,000元/路/月 |
2D小样本免训练(照片素材) | 支持2D小样本免训练(照片素材),分辨率最高1080P。注:与视频素材不可混用,可代替对应小时包 | 12,000元/路/月 |
2D小样本照片 | 支持2D小样本照片,分辨率最高1080p。 | 3,500元/月/路 27,000元/年/路 |
3D卡通 | 支持3D卡通,分辨率最高1080p。 | 3,500元/月/路 27,000元/年/路 |
3D半写实 | 支持3D半写实,分辨率最高1080p。 | 5,200元/月/路 41,000元/年/路 |
3D写实 | 支持3D写实,分辨率最高1080p。 | 6,750元/月/路 54,000元/年/路 |
说明:
默认同一个用户可同时提交1个视频制作任务,由主子账号共享,调用的并发资源是所有客户共享,可能会出现排队等待的情况。
免训练版并发资源为独享,无需额外购买小时包;例如客户购买了2路并发,则一共可同时提交2个免训练视频制作任务。
购买的视频素材和照片素材的小时包或并发不可混用
声音定制
1. 声音复刻
用户可以对数字人播报的声音音色进行复刻,主要分为基础版和极速版。
类别 | 功能描述 | 价格 |
声音复刻-极速版 | 39.9元/个 | |
声音复刻-基础版 | 输入100句语料进行声音复刻,训练时长仅需要1天,主要用于搭配2D小样本,适用于对声音要求不高、预算有限的客户。 | 0 - 10 个(不含 10):10,000 元/个 10 - 20 个(不含 20):8,000 元/个 20 - 50 个(不含 50):5,000 元/个 50个以上:3,000 元/个 |
说明:
基础版声音定制配额自购买后即生效,有效期为一年。后续可购买“定制声音续期”进行续期。极速版永久有效。
2. 定制声音续期
形象类型 | 功能描述 | 价格 |
声音复刻-基础版 | 支持对复刻的声音进行在架服务续期。 | 150元/月/个 |
更多服务
iPaaS(Integration Platform as a Service)的模式,集成配置端(数智人平台)页面并进行主题色、品牌 logo 的配置后,即可在任一业务系统内直接享受到与原生数智人平台一致的云服务。
版本类型 | 功能描述 | 价格 |
基础版 | 享受数智人平台基础版的所有页面交互功能 | 50000元/年 |
高级版 | 获取全新数智人的高级版所有套件,具体请联系我们商务经理。 | 300000元/年 |
私有化服务
若需要购买私有化服务,请联系您的商务经理进行报价。