Serverless AI 运行时是一款专为 Agent 应用设计的全托管、高性能托管平台。它深度融合了 Serverless 架构的弹性伸缩、按量付费和免运维优势,与 AI 工作负载对计算隔离、会话亲和性及安全沙箱的特定需求,为企业提供稳定、高效且经济的 AI 应用托管环境。
说明:
产品优势
原生支持 AI 特性:提供多形态会话亲和性,确保 AI Agent 等有状态应用在多次请求间能保持连续的上下文,避免“失忆”问题。通过强实例安全隔离,为不同用户或任务提供安全可靠的独立运行环境,尤其适合处理敏感数据或多租户场景。
开箱即用的高效体验:提供丰富的、针对 AI 场景优化的应用模板,极大降低 AI 应用部署门槛,实现从概念到部署的“分钟级”落地。
弹性与成本优化:基于 Serverless 架构,可实现毫秒级弹性伸缩,从容应对突发流量。采用按实际资源消耗计费的模式(如按执行时长和内存使用量),在 AI 工作负载波动大的场景下,能显著降低资源闲置成本。
开放的生态兼容性:支持将 Agent Runtime、各类沙箱工具(如浏览器自动化、代码执行环境等)以及遵循模型上下文协议(MCP) 的工具无缝托管到平台上,帮助企业快速集成和扩展 AI 生态能力。
应用场景
1. AI 智能体(Agent)开发与部署
企业可在此平台上部署和运行复杂的 AI 智能体系统,平台的会话亲和性保证了智能体与用户长时间、多轮交互的上下文连续性,而强大的安全隔离特性则为智能体访问外部工具和资源提供了可靠的安全保障。按需伸缩的能力使得智能体服务可以高效应对不同时段的请求量变化。
2. 浏览器自动化与爬虫任务
通过一键部署浏览器沙箱应用模板,企业可以轻松构建大规模、稳定的浏览器自动化任务。平台自动管理浏览器实例的调度和生命周期。
3. 代码生成与安全测试
利用代码沙箱应用模板,平台可为在线编程、代码自动化评测(Online Judge 系统)、第三方代码安全扫描等场景提供安全且隔离的执行环境。自定义应用功能允许企业上传特定版本的语言工具链容器镜像,满足不同技术的测试需求。
4. 模型上下文协议(MCP)服务托管
该平台是托管 MCP Server 的理想选择。由于 MCP 服务数量众多、调用稀疏。平台提供按实际调用次数和时长付费的模式,在无请求时成本近乎为零,实现了成本优化。同时,毫秒级弹性伸缩能力能轻松应对突发流量。