产品优势

GPU 弹性保障

支持分时包月、灵活预约等多种创新性资源供给模式,达到资源保障与成本的完美平衡。

GPU 弹性加速

面向 AI 场景支持从资源分配到模型加载的全栈加速能力。支撑弹性资源秒级交付,让用户轻松应对业务洪峰。

全球调度

支持全球调度、模糊卡型调度等多种资源供给策略,全球 GPU 资源海量供给。

极致成本

更细粒度的 CPU、GPU 算力分配,更精准的持有时长,依托云集中运营降低资源成本。

灵活计费

常驻+按量混合计费、分时包月、竞价实例、灵活启动、节省计划等多种计费模式灵活组合,每种场景都能找到成本最优解。

管理可控

类节点的管理体验,以超级节点维度做资源规划和配置管理,成本可控,分账简单,保证灵活性的同时指数级降低运维管理和财务管理复杂度。

亮点功能

GPU 分时包月
独家推出按每日固定时段包月的超级节点,时段内资源 100% 供给,为周期性业务波峰提供弹性资源保障,价格超低。
GPU 全球调度【邀测】
单集群单超级节点支持调度全球地域 GPU 算力,零业务改造,零管理成本,仅需简单配置即可调度整个腾讯云的低成本 GPU 算力。
可等待任务【邀测】
客户定义计算任务所需资源量、执行时间,平台即可根据要求寻找算力,一旦资源满足任务条件,即刻启动任务,执行过程 100% 保障资源,用最优成本完成客户任务。
混合计费
包月 + 按量混合计费模式,解决资源保障和成本管控难题,通过灵活调整按量包月配额达到成本最优。
成熟可靠
经受千万核运营规模验证的成熟、稳定技术底座
1 秒启动容器
单 Pod 资源准备时长低至 1s 内
数万+ Pod 并发
支持 IDC 场景日并发弹性数十万核
99.9% 弹性成功率
计划内的可保障弹性成功率高于 99.95%

应用场景

  • AI 推理
  • 离线数据处理
  • 大规模高并发弹性
  • 在线游戏
场景介绍

智能客服、计算机视觉等在线近线任务,要求毫秒级低延迟和高吞吐量;文生图/视频、医疗影像、广告创意等离线/批量生成任务,则看重高吞吐量和计算成本,希望通过高效的批处理和弹性资源调度,最大化算力利用率,以最低成本完成周期性的高强度生成和分析任务。

产品优势
  • 全球调度,海量资源实时获取
  • 高性价比,搭配灵活启动、分时、竞价等多种模式,降低推理成本
  • 高稳定性,Pod间强隔离,保障业务稳定运行
  • 轻松运维,无需管理 GPU 节点,专注业务

常见问题

Serverless 容器服务如何收费?

Serverless 容器服务是全托管的无服务器 Kubernetes 服务,提供三种类型的计费模式:预留券、按量计费和竞价模式。详情请参考 产品定价

Serverless 容器服务以超级节点维度承载资源,超级节点上提供两种主要类型的计费模式:包年包月模式、按量计费模式,分别适用于不同场景下的用户需求。详情可参见 计费模式说明

包年包月的超级节点会根据购买资源的总规格进行计费,按量计费的超级节点会根据节点上实际调度的 Pod 规格及运行时长进行计费,具体计算方式请参见 产品定价

如何选择 Pod 资源规格?

如何保证工作负载自动伸缩?

更多问题请查看 常见问题,也可在 问答社区 中进行提问 。

我们致力于为您提供个性化的售前购买咨询服务,以及全面的技术售后服务。