调用统计中提供资源消耗的总数和调用明细,包括用量统计、并发统计和知识库容量统计。
用量统计
用量统计中提供应用服务中模型的 tokens 资源包、搜索服务包用量消耗报表及明细。
统计报表
应用下可查看计费接口调用次数、消耗 token 数、搜索服务消耗次数,支持按时间导出统计明细。

单次调用明细
支持按照调用类型查看每次调用消耗明细。


并发统计
1. 购买专属并发的大模型,支持查看该模型的可用并发数、成功调用并发峰值、调用超可用并发次数,可用并发数≥成功调用并发峰值。
可用并发数:当前模型最大可使用并发数。
成功调用并发峰值:当前筛选时间段内,成功调用当前模型的最大并发数,最大不超过可用并发数。
调用超可用并发次数:当调用超过可用并发时,会触发排队或调用失败的情况,超可用并发的调用次数会被记录。

2. 选择平台预置模型和自定义模型,支持查看该模型的TPM和QPM上限和使用峰值。
调用TPM上限:当前uin模型下的TPM上限。
调用TPM峰值:每分钟统计一次TPM峰值,筛选的统计期间内,展示TPM最大峰值。
调用QPM上限:当前uin模型下的QPM上限。
调用QPM峰值:每分钟统计一次QPM峰值,筛选的统计期间内,展示QPM最大峰值。

知识库容量统计
提供知识库可用字符总数和超量失效字符总数,可通过知识库容量统计中查看各应用知识库的使用及占比情况。
知识库可用字符总数:知识库的字符数总量,包括体验资源和购买的总字符数。
超量失效字符总数:知识库中被处理为超量失效状态知识的字符总数,存在超量失效的字符数需要尽快购买知识库容量包。
