资源管控

最近更新时间:2026-01-26 14:58:01

我的收藏
资源管控支持公有云和私有化部署场景,聚焦系统资源与流量的精细化管理。通过对空间、应用层级的模型资源配额分配、调用频率限制、工作流超时管控等能力,确保资源合理分配、负载均衡,避免系统过载,保障服务持续稳定可用,同时满足不同业务场景下的资源使用需求。

适用角色

主要使用人:运维人员(负责资源配置、监控与调整)。
次要(低频)使用人:业务人员(研发 / 产品 / 运营等,需查看资源配置或申请调整)。

资源管控核心原则

层级配额约束:应用配额 ≤ 空间配额,杜绝 "子级超过父级" 的资源超额分配问题。
资源共享约束:单空间下所有应用的配置总额 ≤ 该空间的配置总额。
实时管控生效:配置修改后实时作用于资源调用,超限触发限流或报错机制。

核心指标说明

资源管控涵盖超时管控和模型管控两大类指标,支持空间和应用两个层级的配置与管控,具体指标定义如下:
指标分类
指标名称
定义
空间支持
应用支持
超时管控
工作流同步调用超时
工作流同步调用的最大响应时间,默认 10 分钟,支持设置秒 / 分钟单位,上限 15 分钟;超时未响应则终止工作流。
工作流异步调用超时
工作流异步调用的最大响应时间,默认 12 小时,支持设置分钟 / 小时单位,上限 24 小时;超时未响应则终止工作流。
模型管控
TPM(Tokens / 分钟)
某主体 1 分钟内最多可消耗的 tokens 总量(输入 + 输出),限制 tokens 消耗速率,每分钟重置;超限则拒绝后续请求。
QPM(请求数 / 分钟)
某主体 1 分钟内最多可发起的大模型调用请求次数,限制调用频率,每分钟重置;超限则拒绝后续请求或排队。
并发上限
基于购买的资源包设置独立并发上限,无资源包则按系统默认配置;超限调用会失败并报错。
其他说明:
1. 资源管控需逐级设置:若空间未进行资源设置,则不支持对该空间下的应用进行资源约束(涉及指标:QPM、TPM)。
2. 应用的 QPM / TPM 调用限制说明:
未设置空间资源管控的应用受租户可调用总额限制。
已设置空间资源管控的应用受空间可调用总额限制。
有设置应用资源管控的应用则受其应用可调用总额限制。

操作指南

1. 企业级资源管控(租户层级)
1.1 入口路径
登录 腾讯云智能体开发控制台,进入企业管理,选择运维管理,单击资源管控。

1.2 列表功能



展示内容:当前租户下所有空间的资源管控信息,包括空间名称、设置状态、修改时间、最后修改人。
筛选功能:支持按空间名称和配置状态(未设置 / 已配置)搜索。
快捷操作:
设置:点击进入该空间的资源管控配置页。
查看数据:点击打开新页面跳转至监控看板,查看资源使用数据。
1.3 配置流程



设置方式选择:
全部资源统一:对空间内所有资源统一配置 QPM 和 TPM。
按资源分别设置(即将上线):针对单个资源(例如:youtu-mrc-pro、deepseek-v3 等)单独配置。
分配规则设置:
勾选需配置的指标(QPM / TPM),输入具体数值,仅支持输入正整数。
约束条件:空间配置额度 ≤ 租户限制总额度;空间配置额度 ≥ 该空间下所有应用已配置额度总和。
已设置应用详情:展示该空间下所有应用已配置的 QPM、TPM 总额度。
保存配置:确认数值无误后单击保存,配置即时生效;单击取消放弃本次设置。
2. 空间级资源管控(应用层级)
2.1 入口路径
登录 腾讯云智能体开发控制台,进入目标工作空间,选择平台管理 > 平台运维,单击资源管控。



2.2 列表功能
当前空间下所有应用的资源管控信息,包括应用名称、配置状态(已设置 / 未设置)、修改时间、最后修改人。
快捷操作:
设置:点击进入该应用的资源管控配置页。
应用共享并发:配置应用的模型调用并发上限(原 "计费资源清单 > 设置并发上限" 功能迁移至此)。
查看数据:点击打开新页面前往查看监控看板。
2.3 配置流程



基础设置:
工作流同步调用:仅支持输入正整数,支持秒 / 分钟单位,默认 10 分钟,上限 60 分钟。
工作流异步调用:仅支持输入正整数,支持分钟 / 小时单位,默认 12 小时,上限 24 小时。
资源管控:
设置方式选择:
全部资源统一:对应用下所有资源统一配置 QPM 和 TPM。
按资源分别设置(即将上线):针对单个资源单独配置。
分配规则设置:
勾选需配置的指标(QPM / TPM),输入具体数值。
约束条件:应用配置额度 ≤ 空间剩余可配置额度(空间剩余额度 = 空间配置总额 - 其他应用已配置总额)。
右侧展示:空间配置详情(QPM / TPM 总额度)和剩余可配置额度。
保存配置:确认数值无误后单击保存,配置即时生效;单击取消放弃本次设置。