有奖:语音产品征文挑战赛火热进行中> HOT
大模型知识引擎提供大模型应用构建平台,根据用户所使用的 token 数、知识库容量、并发数等资源进行计费,目前为公测阶段,注册开通体验即可获得一定量的免费额度。如需购买或扩容,请联系架构师或官网客服

开通方式

大模型知识引擎的开通使用需要先通过腾讯云企业实名认证 或者腾讯云个人实名认证。通过实名认证后,首次在大模型知识引擎产品页单击产品体验时,即可开通大模型知识引擎使用权限,有效期2个月。

免费额度

通过实名认证的主账号首次登录大模型知识引擎产品时,获得一定量的免费体验额度,详情如下图所示。
资源类别
免费额度
精调知识大模型标准版
开通大模型知识引擎服务即获赠累计50万 token 的免费调用额度,有效期2个月;以资源包的形式发放到您的腾讯云账号中,优先扣除。
精调知识大模型高级版
混元大模型标准版
混元大模型高级版
医学大模型标准版
金融大模型标准版
知识库容量
开通大模型知识引擎服务即获赠累计300万字符数的免费知识库容量,主账户无 token 消耗记录半年后回收。
原子能力-多轮改写
开通大模型知识引擎服务即获赠累计50万 token 多轮改写免费额度,用完即止。
原子能力-Embedding
开通大模型知识引擎服务即获赠累计50万 token Embedding 免费额度,用完即止。
说明:
在以下场景/功能中发生交互时,会对 tokens 产生消耗:
应用配置管理:
应用配置-角色设定中,一键优化功能
知识库管理-问答-导入问答-文档生成问答对
知识库管理-任务流程-插入节点-自动生成询问语
知识库管理-任务流程-插入节点-自动生成答案的预览
问答过程中,在应用配置中测试、应用发布后调用应用 API /使用体验链接、应用评测、应用体验:
计算消耗内容:包括用户的输入+系统 prompt +召回信息(含文档、问答、开启搜索引擎后搜索召回的内容)+输出
备注:
1. token 换算方式:1 token ≈ 1~1.5个汉字。
2. 基于已配置的任务流程会调用任务型专属模型,消耗对应的 token。
3. 应用对话交互中触发的应用配置的欢迎语、输出配置-回复设置中自定义的保守回复、敏感词拦截后的回复不计入 token 消耗。
4. 如不使用任务流程和搜索引擎,建议关闭"应用配置-知识来源"中的相关开关,以减少额外的 token 消耗。
5. 应用配置-知识来源中,文档和问答的召回数量会影响召回 token ,设定的数量越高,拼接输入到大模型的召回片段越多,消耗 token 数量相应增加。
注意:
在账单结算时,系统将按照免费资源包 > 预付费资源包的顺序进行结算,即免费资源包是优先扣除的。
若您欠费或因违禁原因停服后,将不能继续享受免费额度,只有服务重新开启后才可继续享受免费额度。
精调知识大模型标准版、精调知识大模型高级版、混元大模型标准版、混元大模型高级版、金融行业大模型标准版、医学行业大模型标准版共用50万 token 免费额度。

产品价格

预付费 tokens 资源包

定义:一次性购买一定数量的 tokens 资源包,有效期内调用模型服务时优先抵扣资源包当中的 tokens 余量, tokens 资源包如果到期未用完,会当做过期作废处理。
资源包有效期:1年,1年后未使用的资源包清零。
付费方式:预付费,购买 tokens 资源包越大,单价越低。
适用范围:稳定调用,具有一定规模的业务体量。
token资源包
精调知识大模型标准版
精调知识大模型高级版
混元大模型标准版
混元大模型高级版
医学大模型标准版
金融大模型标准版
1000万 token
¥120
¥1,200
¥120
¥1,200
¥120
¥180
5000万 token
¥600
¥6,000
¥600
¥6,000
¥600
¥900
1亿 token
¥1,180
¥11,800
¥1,180
¥11,800
¥1,180
¥1,770
5亿 token
¥5,900
¥59,000
¥5,900
¥59,000
¥5,900
¥8,850
10亿 token
¥11,700
¥117,000
¥11,700
¥117,000
¥11,700
¥17,550
注意:
购买的预付费 tokens 资源包有效期为1年,1年后未使用的资源包清零。
账户基础购买 tokens 预付费配额后,服务并发数保持不变,如果无法满足实际的业务需求,可按需增购并发

知识库容量

定义:知识库容量计算用户所有应用上传的文档和问答的总字符数,删除的文档和应用不占用知识库容量。
资源包有效期:1年,1年后如需继续使用,请续费。已扩容的知识库不支持除删除之外的操作。
付费方式:包年。
知识库扩容包
价格
1000万字符
¥1,800
1亿字符
¥16,000
注意:
字符数不计算文档中的空格,文档中存在图片的将转存为图片链接,每张图大约换算为150个字符。
一篇3万字的硕士论文,大约相当于4万字符,50页文档。1000万字符约为250篇硕士论文,1亿字符约为7500篇硕士论文。

搜索服务包

知识引擎提供搜索服务,如您在知识来源中勾选了搜索引擎,则每次调用搜索引擎将会扣减搜索服务次数。搜索服务资源包根据业务量级划分为不同规格,可一次性付费购买,自购买日起一年内有效,一年内若资源包未使用完,则过期作废。
资源包规格
价格
10万次
¥2,200
50万次
¥11,000
100万次
¥20,000
500万次
¥90,000
1000万次
¥170,000

并发资源

定义:同时进行的会话数量,从请求发起到流式返回全部结果的整个过程都算在占用并发,一个对话占用并发时间约3-15秒不等。
模型:仅支持精调知识大模型标准版。
付费方式:包月包年。
并发类型
并发数量
包月
包年
备注
共享并发
1并发增购
¥800
¥9,200
账号默认5并发,可在此基础上增购
2并发增购
¥1,250
¥15,000
5并发增购
¥3,000
¥35,000
专属并发
1并发
17,000
¥200,000
5并发起购(增购可按照1、2、5并发增购)
2并发
24,000
¥280,000
5并发
34,000
¥400,000

原子能力

知识引擎支持以 API 形式提供原子能力接口,支持具有开发能力的用户自行搭建大模型应用,拓展大模型能力边界。
原子能力资源包根据业务量级划分为不同规格,可一次性付费购买,自购买日起一年内有效,一年内若资源包未使用完,则过期作废。
注意:
调用量的扣费顺序为:免费额度->资源包,即先消耗账号中的免费额度,免费额度耗尽后再消耗资源包。

Embedding

Embedding 原子能力可通过 API 进行调用,点击 Embedding 查看API文档。资源包自购买日起一年内有效,一年内若资源包未使用完,则过期作废。
资源包大小
价格
5000万 token
¥100
1亿 token
¥200
5亿 token
¥900
10亿 token
¥1,800

多轮改写

多轮改写原子能力可通过 API 进行调用,点击多轮改写查看API文档。资源包自购买日起一年内有效,一年内若资源包未使用完,则过期作废。
资源包大小
价格
1000万 token
¥60
5000万 token
¥300
1亿 token
¥600
5亿 token
¥2,800
10亿 token
¥5,600