AI 网关是腾讯云智能网关推出的面向大模型与智能化场景的新一代网关产品。它专注于解决企业接入、调度和管理多种 AI 模型时面临的协议复杂、治理困难、成本不可控及存量业务改造门槛高等核心问题。
AI 网关作为企业智能化架构的流量入口与治理中枢,融合大模型网关、MCP 网关与 Agent 网关三大角色,通过统一的协议适配、智能的路由调度与全方位的可观测能力,帮助企业高效、安全、经济地集成与使用 AI 能力,加速业务创新与智能化转型。
产品特色
智能模型治理:统一接入并智能调度腾讯云混元、开源模型及第三方商业模型,通过负载均衡、熔断降级与成本优化策略,实现性能、成本与稳定性的最佳平衡。
存量业务快速 AI 化:内置强大的协议转换引擎,支持 MCP、OpenAI 等 AI 生态协议与传统 HTTP/gRPC 等业务协议的双向转换,助力存量业务系统快速具备 AI 能力,有效保护企业现有 IT 投资。
全链路安全合规:构建从接入认证、参数过滤到数据脱敏的多层次安全防护体系,集成 WAF、DDoS 防护等能力,保障 AI 应用合规、安全、可靠地运行。
企业级高可用保障:采用多可用区高可用部署架构,支持自动故障转移与实例弹性扩缩容,服务可用性有保障。
业务场景
场景一:多模型统一治理与智能调度
核心问题:企业需同时使用多个 AI 模型,但缺乏统一平台,导致模型使用混乱、资源配置低效、成本不可控。
解决方案:AI 网关作为统一入口,实现多模型的可视化接入与管理。通过智能路由策略,根据请求内容、模型性能、成本等因素自动选择最优模型,并配合限流、熔断机制保障服务稳定性,实现降本增效。
适用客户:已经接入多个模型的企业,既用公有云模型,也用私有化模型的客户,需要统一模型治理的客户。

场景二:存量业务系统 AI 化改造
核心问题:企业存量业务系统沉淀了大量核心数据与业务逻辑,是企业最有价值的资产。但这些系统普遍以 REST/HTTP 接口形式对外提供服务,无法直接被 AI Agent 以 MCP 协议调用,导致 AI 能力难以快速与现有业务能力打通,存量系统的价值无法在 AI 时代得到充分释放。
解决方案:AI 网关通过协议转换引擎,将存量业务系统提供的标准 API 自动包装成 AI 应用可调用的标准化工具(MCP Tool),实现业务能力的“零代码改造” AI 化。开发人员无需关注底层集成细节,即可快速构建智能应用。
适用客户:已有大量存量 API 的企业,希望推动传统服务 AI 化改造的客户,需要统一工具治理的平台型客户。

场景三:Agent 间调用和出入口安全
核心问题:企业会出现多个 Agent 时,多 Agent 调用链路复杂,缺少统一入口,不同 Agent 身份、权限、可调用范围难管理,当 Agent 与Agent 进行调用时,缺少 A2A 调用路由、审计、出入口安全控制。
解决方案:AI 网关不仅要管理模型和工具,也要管理 Agent 与 Agent 之间的调用,以及 Agent 对内对外开放的出入口。通过 Agent API 统一开放不同协议的 Agent,实现访问控制,通过标准 A2A 协议进行调用鉴权、路由、限流与审计。对内作为 Agent 治理总线,对外作为 Agent 开放平台。
适用客户:有多 Agent 编排需求的客户,云厂商/平台方,希望对外开放 Agent 能力,重视 Agent 安全与调用链治理的企业。
功能特性
功能点 | 说明 |
统一协议接入 | 全面支持 OpenAI、Anthropic、MCP、SSE、Streamable HTTP 等 AI 主流协议,提供协议间自动转换能力,兼容 RESTful 等传统协议,一套网关统一承接模型 API 调用、MCP 工具请求与 Agent 流量,使企业已有业务系统无需改造即可直接接入大模型和 MCP。 |
模型服务管理 | 支持主流 SaaS 模型、MaaS 供应商、推理服务及私有化模型统一纳管,提供万级密钥集中管控、请求参数改写及供应商可用模型自动探测。支持模型服务 Fallback 容灾,主模型异常时自动切换备用节点,有效降低多模型并存场景下的运维复杂度与可用性风险。 |
智能路由 | 提供权重路由、延迟优先、配额感知、Token 长度梯度、基于请求意图的语义路由、前缀缓存路由等多种可灵活组合的路由策略,支持最多 50 条规则配置,帮助企业将不同类型请求精准分发至最合适的模型服务,在保障服务质量的同时有效控制推理成本。 |
MCP 网关 | 提供完整的 MCP 服务生命周期管理,支持标准 MCP Server 域名接入(自动获取工具列表)、HTTP 存量服务一键 MCP 化及存量服务零改造接入。工具层面支持分组、版本管理、灰度发布、调用限流与鉴权,内置 MCP 市场提供开箱即用工具集,帮助企业在扩展 AI 工具能力的同时保持安全可控。 |
Agent 网关 | 支持 AgentAPI 统一创建与路由管理,兼容 A2A(Agent-to-Agent)协议,原生对接 Dify 等主流智能体平台,为多 Agent 协作架构提供统一的流量入口与权限管控层,支撑 AI Agent 应用从试验走向企业级规模化落地。 |
精细化流量治理 | 提供 QPM 请求数限流、TPM/TPH/TPD Token 级限流、并发数限流及时间窗口差异化限流,支持流量镜像、熔断与自动降级,以及实例弹性伸缩,从请求到 Token 全维度保障模型服务在突发流量下的稳定性。 |
AI 安全防护 | 集成提示词注入防护、敏感词检测与内容合规过滤、AI 数据脱敏等 AI 原生安全能力,认证方面支持 OAuth 2.0、JWT、OIDC 等主流标准,可与企业现有身份体系无缝集成,配合强制 HTTPS 与地域访问屏蔽全面满足企业安全合规要求。 |
配额与成本管理 | 支持按项目/团队/Agent 粒度分配独立调用配额(含并发数与 Token 配额),配额不足时自动降级。提供多维度 Token 消耗统计与跨部门成本分摊报表,支持多渠道差异化单价与阶梯定价配置,提供精确缓存与语义缓存能力,有效降低整体 AI 费用。 |
细粒度权限管理 | 通过消费者与消费者组的多级权限模型实现不同团队、项目间的资源隔离与共享,支持标签化分级权限管理及对接企业用户体系,消费者密钥支持万级规模,为企业搭建内部 AI 开放平台提供权限底座。 |
全链路可观测性 | 提供从用户请求到模型响应的全链路追踪,覆盖 API 调用延迟、Token 消耗、模型费用、MCP 工具调用等核心指标,支持多种类型日志、请求级内容采集与操作审计日志,并提供智能异常告警与配额预警通知。 |
开放 API 与平台集成 | 开放核心资源云 API 支持程序化全生命周期管理,对接 TokenHub 实现 Token 资产联合管控,对接 Tione 推理服务支持私有化模型直连,对接 CLS 实现会话管理与全链路日志追踪,与腾讯云 AI 全栈产品形成体系化联动。 |