文档中心>云函数>AI 应用>Serverless AI 运行时>Serverless AI 运行时概述(内测中)

Serverless AI 运行时概述(内测中)

最近更新时间:2025-09-30 17:03:11

我的收藏
Serverless AI 运行时​​是一款专为 Agent 应用设计的​​全托管、高性能托管平台​​。它深度融合了 Serverless 架构的​​弹性伸缩​​、​​按量付费​​和​​免运维​​优势,与 AI 工作负载对​​计算隔离​​、​​会话亲和性​​及​​安全沙箱​​的特定需求,为企业提供稳定、高效且经济的 AI 应用托管环境。
说明:
此功能处于内测阶段,如需使用,请提交 内测申请

产品优势

原生支持 AI 特性​​:提供​​多形态会话亲和性​​,确保 AI Agent 等有状态应用在多次请求间能保持连续的上下文,避免“失忆”问题。通过​​强实例安全隔离​​,为不同用户或任务提供安全可靠的独立运行环境,尤其适合处理敏感数据或多租户场景。
​​开箱即用的高效体验​​:提供丰富的、针对 AI 场景优化的​​应用模板​​,极大降低 AI 应用部署门槛,实现从概念到部署的“分钟级”落地。
​​弹性与成本优化​​:基于 Serverless 架构,可实现​​毫秒级弹性伸缩​​,从容应对突发流量。采用​​按实际资源消耗计费​​的模式(如按执行时长和内存使用量),在 AI 工作负载波动大的场景下,能显著降低资源闲置成本。
​​开放的生态兼容性​​:支持将​​ Agent Runtime​​、各类​​沙箱工具​​(如浏览器自动化、代码执行环境等)以及遵循​​模型上下文协议(MCP)​​ 的工具无缝托管到平台上,帮助企业快速集成和扩展 AI 生态能力。

应用场景

1. AI 智能体(Agent)开发与部署
企业可在此平台上部署和运行复杂的 AI 智能体系统,平台的​会话亲和性​保证了智能体与用户长时间、多轮交互的上下文连续性,而​强大的安全隔离​特性则为智能体访问外部工具和资源提供了可靠的安全保障。​按需伸缩​的能力使得智能体服务可以高效应对不同时段的请求量变化。
2. 浏览器自动化与爬虫任务
通过一键部署​​浏览器沙箱应用​​模板,企业可以轻松构建大规模、稳定的浏览器自动化任务。平台自动管理浏览器实例的调度和生命周期。
3. 代码生成与安全测试
利用​​代码沙箱应用​​模板,平台可为在线编程、代码自动化评测(Online Judge 系统)、第三方代码安全扫描等场景提供​​安全且隔离的执行环境​​。自定义应用功能允许企业上传特定版本的语言工具链容器镜像,满足不同技术的测试需求。
4. 模型上下文协议(MCP)服务托管
该平台是托管​​ MCP Server​​ 的理想选择。由于 MCP 服务数量众多、调用稀疏​。平台提供按实际调用次数和时长付费​的模式,在无请求时成本近乎为零,实现了成本优化。同时,毫秒级弹性伸缩​能力能轻松应对突发流量。