用量统计

最近更新时间:2026-04-03 16:27:22

我的收藏

功能概述

用量统计 页面帮助您全面监控 AI 资源消耗,支持从三个维度查看数据:
服务维度:查看特定在线推理服务的用量。
模型维度:查看每个模型的调用量、Token 消耗及免费额度。
Key 维度:查看不同 API Key 的调用情况。

模型用量

按模型维度汇总调用数据,支持按模型类型分类查看。

分类筛选

页面顶部提供分类标签,快速筛选不同模型类型,同时支持按在线推理服务、API Key 筛选,查看特定服务的调用情况。
模型类型
包含模型
文本生成
DeepSeek V3、DeepSeek R1、HY-2.0、GLM-5、kimi-k2.5、MiniMax-M2.5 等
图片生成
HY-Image-Lite、HY-Image-V3.0
视频生成
HY-Video-1.5、YT-Video-2.0、YT-Video-FX、YT-Video-HumanActor
3D 生成
HY-3D-3.0、HY-3D-3.1、HY-3D-Express

调用指标

各模型在选定时间范围内的关键调用指标,统计粒度支持 1分钟 / 5分钟 / 1小时:
字段
模型类型
说明
总 Token 数
文本生成
输入 Token 数 + 输出 Token 数。
输入 Token 数
请求(Prompt)部分消耗的 Token 数量。
输出 Token 数
模型响应(Completion)部分消耗的 Token 数量。
每分钟总 Token 数
每分钟输入 Token 数 + 每分钟输出 Token 数。
每分钟输入 Token 数
每分钟输入侧的 Token 吞吐量(tokens/min)。
每分钟输出 Token 数
每分钟输出侧的 Token 吞吐量(tokens/min)。
调用次数
图像生成
视频生成
3D 生成
API 发起并执行的请求总次数,反映服务使用频次。
并发任务数峰值
统计周期内,同一时间同时执行的任务数量的最大值,体现业务高峰期的并发压力。
并发任务数配额
平台允许用户同时执行的最大任务数量上限,为系统可控的并发限制阈值,超出将触发限流。
消耗积分数
视频生成
3D 生成
调用接口过程中,根据模型、时长、并发等计费规则所扣除的积分总量,用于统计资源消耗成本。
时间
所有模型
请求时间区间。

用量趋势图

以可视化图表呈现调用趋势,每项指标均提供最大值、最小值、平均值三项统计摘要,帮助用户快速识别用量峰值与整体趋势。

文本生成

提供六项 Token 维度的趋势监控:
Token 消耗趋势:总 Token 数 / 输入 Token 数 / 输出 Token 数随时间的变化走势
Token 吞吐趋势:每分钟总 Token 数 / 每分钟输入 Token 数 / 每分钟输出 Token 数的并发量变化


图像生成/视频生成/3D 生成

提供四项调用维度的趋势监控:
图表
说明
接口调用详情
展示模型的调用次数随时间的变化趋势。
并发任务峰值详情
展示并发请求的峰值变化,用于评估突发流量。
并发任务配额详情
展示当前并发配额的使用情况,便于容量规划。
消耗积分数详情(仅视频生成、3D 生成提供)
展示模型的积分消耗量随时间的变化趋势。