本文介绍如何在 Serverless AI 运行时部署 Agent Runtime 应用。
说明:
前置依赖
1. 服务授权:在 腾讯云控制台 中,选择云产品 > 云函数,进入 Serverless 控制台,按照界面提示为云函数授权;单击 Serverless 应用,按照界面提示为 Serverless 应用授权。(如果您已授权,请跳过该步骤。)
2. Agent 运行时应用支持容器镜像服务企业版和个人版的镜像仓库,您可以根据自身的实际需求进行镜像仓库选型。
购买容器镜像服务企业版实例,详情可参见 快速入门。
使用容器镜像服务个人版镜像仓库,详情可参见 快速入门。
操作步骤
1. 登录 Serverless 控制台,单击左侧导航栏的 Agent。
2. 在 Serverless AI 运行时页面上的 Agent 运行时区域,单击创建应用,进入应用创建流程。

3. 在基础配置板块:
3.1 填入应用名称:应用的唯一标识,不可重复,创建后不可修改。
3.2 选择地域:资源必须归属于某个地域。
3.3 镜像:选择提前上传到镜像仓库的镜像,镜像要求请参见 WebServer 镜像函数。

4. 在环境配置板块:
4.1 选择内存:设置资源类型对应的规格,当前仅支持 CPU 不同内存配置,详情请参见 函数算力支持。
4.2 添加环境变量,在配置中定义的环境变量可在函数运行时从环境中获取到。详情请参见 环境变量。

5. 在网络配置板块,配置函数网络访问权限:
公网访问:默认启用,关闭后应用无法访问公网资源。
私有网络:启用后,应用可以访问同一个私有网络下的资源。

6. 在日志配置板块:启用日志投递,可将函数运行日志实时投递到指定位置。详情请参见 日志投递配置。

7. 在隔离、并发配置板块:配置实例安全隔离和单实例并发模式。

7.1 开启实例安全隔离,保证每一次会话信息独占一个实例,会话销毁,实例也销毁。
7.2 配置基于会话单实例并发模式,配置项说明如下:
配置项 | 说明 | 示例 |
会话 Key 来源 | 用于说明从哪里获取客户端标识,系统根据此标记来决定要调度到同个实例上。可选项:Http Header、Cookie、Query String、MCP SSE、MCP Streamable HTTP,五选一。不同选项支持场景说明如下: Http Header 通过 HTTP 请求头传递客户端会话标识,后台确保相同标识的请求被路由到同一个实例。适用于 WebSocket 协议、gRPC 协议、HTTP 协议。支持客户端自定义会话 ID(SessionId) ,也支持服务端生成。 Cookie 将携带相同 Cookie 信息的请求路由到同一个实例。支持客户端生成会话 ID(SessionId) ,也支持服务端生成。 Query String 客户端在 QueryString 中自定义会话 ID,相同会话 ID(SessionId) 的请求路由到同一个实例。 MCP SSE 基于 MCP SSE 协议规范,确保客户端携带相同会话 ID(SessionId) 的请求始终路由到同一个实例。 MCP Streamable HTTP 基于 MCP HTTP 协议规范,确保客户端携带相同会话 ID(SessionId) 的请求始终路由到同一个实例。 | Http Header |
会话 Key 名称 | 1. Key 用途及命名规则: 用途:用于指定会话标识的名称(即 Key),作为会话的唯一标识名称。MCP SSE 来源的 Key 默认是 session_id,MCP Streamable HTTP 来源的 Key 默认是 mcp-session-id,如果服务端有重新定义,可以手动修改匹配服务端的 Key。 命名要求:必须以字母开头;非首字母可包含数字、字母、下划线(_)、中划线(-);长度限制5-40 个字符(含边界值)。 2. Key 对应 Value 生成逻辑及字符要求: 生成逻辑: 来源为 Http Header、Cookie:支持客户端在首次调用时自主生成 Value;若客户端未生成,系统将自动生成。 来源为 QueryString:首次 Value 需由客户端生成。 来源为 MCP SSE、MCP Streamable HTTP:首次 Value 由 MCP 服务端生成。 字符要求: 含数字、字母、下划线(_)、中划线(-)长度限制128个字节。 | session-id |
SSE 路径 | 如果会话 Key 来源选择 MCP SSE,需要填写发起 SSE 连接请求的路径。 ![]() | 默认 /sse ,支持修改 |
单实例最大并发会话数 | 单实例在同一时间内能同时处理的最大会话数(包含活跃会话和非活跃会话),默认值为20,最大支持100。 | 20 |
会话最长生命周期 | 从会话创建、使用到最终销毁的全过程,单位秒。超过生命周期后,服务端将自动销毁会话。最长可设置7天,默认21600秒。 | 21600秒 |
会话最长空闲时间 | 用户在一段时间内没有进行任何操作,导致会话进入空闲状态,单位秒。超过设置的最长空闲(Idle)时间后,服务端将自动销毁会话。最长可设置1800秒。 | 1800秒 |
单实例最大并发请求数 | 单实例在同一时间内能同时处理的最大请求数,默认为10,最大支持100。 | 10 |
会话空闲超时处理策略 | 如果您开启了实例安全隔离,会话空闲超时处理策略可选自动销毁或者自动暂停。 如果您没有开启实例安全隔离,会话空闲超时处理策略默认自动销毁。 | 自动销毁 |
8. 单击提交,启动应用的部署。
9. 应用部署完成后,在应用详情页面,可以获得访问地址。如果需要在浏览器访问,可以配置 自定义域名。
