大模型知识引擎提供大模型应用构建平台,根据用户所使用的 token 数、知识库容量、并发数等资源进行计费,目前为公测阶段,注册开通体验即可获得一定量的免费额度。如需购买或扩容,请联系架构师或官网客服。
开通方式
免费额度
通过实名认证的主账号首次登录大模型知识引擎产品时,获得一定量的免费体验额度,详情如下图所示。
资源类别 | 免费额度 |
精调知识大模型标准版 | 开通大模型知识引擎服务即获赠累计50万 token 的免费调用额度,有效期2个月;以资源包的形式发放到您的腾讯云账号中,优先扣除。 |
精调知识大模型高级版 | |
混元大模型标准版 | |
混元大模型高级版 | |
医学大模型标准版 | |
金融大模型标准版 | |
知识库容量 | 开通大模型知识引擎服务即获赠累计300万字符数的免费知识库容量,主账户无 token 消耗记录半年后回收。 |
原子能力-多轮改写 | 开通大模型知识引擎服务即获赠累计50万 token 多轮改写免费额度,用完即止。 |
原子能力-Embedding | 开通大模型知识引擎服务即获赠累计50万 token Embedding 免费额度,用完即止。 |
说明:
在以下场景/功能中发生交互时,会对 tokens 产生消耗:
应用配置管理:
应用配置-角色设定中,一键优化功能
知识库管理-问答-导入问答-文档生成问答对
知识库管理-任务流程-插入节点-自动生成询问语
知识库管理-任务流程-插入节点-自动生成答案的预览
问答过程中,在应用配置中测试、应用发布后调用应用 API /使用体验链接、应用评测、应用体验:
计算消耗内容:包括用户的输入+系统 prompt +召回信息(含文档、问答、开启搜索引擎后搜索召回的内容)+输出
备注:
1. token 换算方式:1 token ≈ 1~1.5个汉字。
2. 基于已配置的任务流程会调用任务型专属模型,消耗对应的 token。
3. 应用对话交互中触发的应用配置的欢迎语、输出配置-回复设置中自定义的保守回复、敏感词拦截后的回复不计入 token 消耗。
4. 如不使用任务流程和搜索引擎,建议关闭"应用配置-知识来源"中的相关开关,以减少额外的 token 消耗。
5. 应用配置-知识来源中,文档和问答的召回数量会影响召回 token ,设定的数量越高,拼接输入到大模型的召回片段越多,消耗 token 数量相应增加。
注意:
在账单结算时,系统将按照免费资源包 > 预付费资源包的顺序进行结算,即免费资源包是优先扣除的。
若您欠费或因违禁原因停服后,将不能继续享受免费额度,只有服务重新开启后才可继续享受免费额度。
精调知识大模型标准版、精调知识大模型高级版、混元大模型标准版、混元大模型高级版、金融行业大模型标准版、医学行业大模型标准版共用50万 token 免费额度。
产品价格
预付费 tokens 资源包
定义:一次性购买一定数量的 tokens 资源包,有效期内调用模型服务时优先抵扣资源包当中的 tokens 余量, tokens 资源包如果到期未用完,会当做过期作废处理。
资源包有效期:1年,1年后未使用的资源包清零。
付费方式:预付费,购买 tokens 资源包越大,单价越低。
适用范围:稳定调用,具有一定规模的业务体量。
token资源包 | 精调知识大模型标准版 | 精调知识大模型高级版 | 混元大模型标准版 | 混元大模型高级版 | 医学大模型标准版 | 金融大模型标准版 |
1000万 token | ¥120 | ¥1,200 | ¥120 | ¥1,200 | ¥120 | ¥180 |
5000万 token | ¥600 | ¥6,000 | ¥600 | ¥6,000 | ¥600 | ¥900 |
1亿 token | ¥1,180 | ¥11,800 | ¥1,180 | ¥11,800 | ¥1,180 | ¥1,770 |
5亿 token | ¥5,900 | ¥59,000 | ¥5,900 | ¥59,000 | ¥5,900 | ¥8,850 |
10亿 token | ¥11,700 | ¥117,000 | ¥11,700 | ¥117,000 | ¥11,700 | ¥17,550 |
注意:
购买的预付费 tokens 资源包有效期为1年,1年后未使用的资源包清零。
账户基础购买 tokens 预付费配额后,服务并发数保持不变,如果无法满足实际的业务需求,可按需增购并发。
知识库容量
定义:知识库容量计算用户所有应用上传的文档和问答的总字符数,删除的文档和应用不占用知识库容量。
资源包有效期:1年,1年后如需继续使用,请续费。已扩容的知识库不支持除删除之外的操作。
付费方式:包年。
知识库扩容包 | 价格 |
1000万字符 | ¥1,800 |
1亿字符 | ¥16,000 |
注意:
字符数不计算文档中的空格,文档中存在图片的将转存为图片链接,每张图大约换算为150个字符。
一篇3万字的硕士论文,大约相当于4万字符,50页文档。1000万字符约为250篇硕士论文,1亿字符约为7500篇硕士论文。
搜索服务包
知识引擎提供搜索服务,如您在知识来源中勾选了搜索引擎,则每次调用搜索引擎将会扣减搜索服务次数。搜索服务资源包根据业务量级划分为不同规格,可一次性付费购买,自购买日起一年内有效,一年内若资源包未使用完,则过期作废。
资源包规格 | 价格 |
10万次 | ¥2,200 |
50万次 | ¥11,000 |
100万次 | ¥20,000 |
500万次 | ¥90,000 |
1000万次 | ¥170,000 |
并发资源
定义:同时进行的会话数量,从请求发起到流式返回全部结果的整个过程都算在占用并发,一个对话占用并发时间约3-15秒不等。
模型:仅支持精调知识大模型标准版。
付费方式:包月包年。
并发类型 | 并发数量 | 包月 | 包年 | 备注 |
共享并发 | 1并发增购 | ¥800 | ¥9,200 | 账号默认5并发,可在此基础上增购 |
| 2并发增购 | ¥1,250 | ¥15,000 | |
| 5并发增购 | ¥3,000 | ¥35,000 | |
专属并发 | 1并发 | 17,000 | ¥200,000 | 5并发起购(增购可按照1、2、5并发增购) |
| 2并发 | 24,000 | ¥280,000 | |
| 5并发 | 34,000 | ¥400,000 | |
原子能力
知识引擎支持以 API 形式提供原子能力接口,支持具有开发能力的用户自行搭建大模型应用,拓展大模型能力边界。
原子能力资源包根据业务量级划分为不同规格,可一次性付费购买,自购买日起一年内有效,一年内若资源包未使用完,则过期作废。
注意:
调用量的扣费顺序为:免费额度->资源包,即先消耗账号中的免费额度,免费额度耗尽后再消耗资源包。
Embedding
资源包大小 | 价格 |
5000万 token | ¥100 |
1亿 token | ¥200 |
5亿 token | ¥900 |
10亿 token | ¥1,800 |
多轮改写
资源包大小 | 价格 |
1000万 token | ¥60 |
5000万 token | ¥300 |
1亿 token | ¥600 |
5亿 token | ¥2,800 |
10亿 token | ¥5,600 |