功能概述
服务维度:查看特定在线推理服务的用量。
模型维度:查看每个模型的调用量、Token 消耗及免费额度。
Key 维度:查看不同 API Key 的调用情况。
模型用量
按模型维度汇总调用数据,支持按模型类型分类查看。
分类筛选
页面顶部提供分类标签,快速筛选不同模型类型,同时支持按在线推理服务、API Key 筛选,查看特定服务的调用情况。
模型类型 | 包含模型 |
文本生成 | DeepSeek V3、DeepSeek R1、HY-2.0、GLM-5、kimi-k2.5、MiniMax-M2.5 等 |
图片生成 | HY-Image-Lite、HY-Image-V3.0 |
视频生成 | HY-Video-1.5、YT-Video-2.0、YT-Video-FX、YT-Video-HumanActor |
3D 生成 | HY-3D-3.0、HY-3D-3.1、HY-3D-Express |
调用指标
各模型在选定时间范围内的关键调用指标,统计粒度支持 1分钟 / 5分钟 / 1小时:
字段 | 模型类型 | 说明 |
总 Token 数 | 文本生成 | 输入 Token 数 + 输出 Token 数。 |
输入 Token 数 | | 请求(Prompt)部分消耗的 Token 数量。 |
输出 Token 数 | | 模型响应(Completion)部分消耗的 Token 数量。 |
每分钟总 Token 数 | | 每分钟输入 Token 数 + 每分钟输出 Token 数。 |
每分钟输入 Token 数 | | 每分钟输入侧的 Token 吞吐量(tokens/min)。 |
每分钟输出 Token 数 | | 每分钟输出侧的 Token 吞吐量(tokens/min)。 |
调用次数 | 图像生成 视频生成 3D 生成 | API 发起并执行的请求总次数,反映服务使用频次。 |
并发任务数峰值 | | 统计周期内,同一时间同时执行的任务数量的最大值,体现业务高峰期的并发压力。 |
并发任务数配额 | | 平台允许用户同时执行的最大任务数量上限,为系统可控的并发限制阈值,超出将触发限流。 |
消耗积分数 | 视频生成 3D 生成 | 调用接口过程中,根据模型、时长、并发等计费规则所扣除的积分总量,用于统计资源消耗成本。 |
时间 | 所有模型 | 请求时间区间。 |
用量趋势图
以可视化图表呈现调用趋势,每项指标均提供最大值、最小值、平均值三项统计摘要,帮助用户快速识别用量峰值与整体趋势。
文本生成
提供六项 Token 维度的趋势监控:
Token 消耗趋势:总 Token 数 / 输入 Token 数 / 输出 Token 数随时间的变化走势
Token 吞吐趋势:每分钟总 Token 数 / 每分钟输入 Token 数 / 每分钟输出 Token 数的并发量变化

图像生成/视频生成/3D 生成
提供四项调用维度的趋势监控:
图表 | 说明 |
接口调用详情 | 展示模型的调用次数随时间的变化趋势。 |
并发任务峰值详情 | 展示并发请求的峰值变化,用于评估突发流量。 |
并发任务配额详情 | 展示当前并发配额的使用情况,便于容量规划。 |
消耗积分数详情(仅视频生成、3D 生成提供) | 展示模型的积分消耗量随时间的变化趋势。 |
