首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >腾讯云智算底座助力出行AI:从数据存储到模型训练的降本增效实践

腾讯云智算底座助力出行AI:从数据存储到模型训练的降本增效实践

原创
作者头像
IT资讯研究所
发布2026-05-31 20:52:27
发布2026-05-31 20:52:27
70
举报

数据来源: 2025 TIME DAY·腾讯智慧出行技术开放日(智算·AI技术底座新智能专场)

关键发言人: 宋丹丹(腾讯云异构计算产品副总经理)、王登宇(腾讯云存储专家架构师)

智能汽车数据基础设施面临的三大业务瓶颈

随着自动驾驶级别提升,智能汽车数据闭环(采集、存储、计算、发布)对基础架构提出严苛要求,行业普遍面临以下瓶颈:

  1. 数据吞吐与存储压力: 感知数据产生速度从L2级的200GB/小时激增至高阶智驾的1.6TB/小时。某主流自动驾驶客户数据量已达 100PB+ 量级,高读写效率成为刚需。
  2. 算力利用率与成本矛盾: 大规模高带宽组网存在冗余,仿真环节需要平衡算力需求与成本控制。传统架构下,GPU资源常面临利用率低、多任务并发能力弱的问题。
  3. 数据合规与处理时效: 某头部车企面临百万量级车辆接入,数据峰值吞吐带宽高达 649.5Gbps,且必须在 $T+1$小时内 完成处理,同时需满足端到端的数据安全合规要求。

构建云上智算与存储一体化解决方案

针对上述痛点,腾讯云通过“异构计算+存储底座+网络加速”的组合方案提供服务:

  1. 高性能计算集群(HCC): 搭载3.2Tbps自研星脉网络,支持 200Gbps vRDMA多机互联,实现集群算力近无损扩展。通过TACO Train加速框架,实现软硬协同优化。
  2. 腾讯云Data Platform: 以COS对象存储为统一底座(单集群可管理 百EB级 数据),结合GooseFS 2.0(提供百万级IOPS)与MetalInsight智能检索,构建端到端的数据湖仓。
  3. 云函数SCF与vRDMA网络: 国内首发GPU混合调度,支持5%超细粒度切分(qGPU)与毫秒级弹性扩缩容(最高支持 10万并发)。自研vRDMA无需额外网卡硬件成本,业务零适配。

量化业务指标与ROI提升

通过具体技术方案的落地,在自动驾驶训练、仿真及数据处理环节实现了明确的效率提升与成本优化:

核心业务指标

数值提升/降低

备注

自动驾驶训练性能

提升30%

基于COS+GooseFS方案,解决100PB+数据读写需求

业务成本节省

降低20%

基于vRDMA 200Gbps多机互联,无额外硬件成本

仿真成本

降低30%

通过最佳实例搭配与多任务共享GPU(利用率达60%)

数据预处理成本

降低50%

云函数SCF多任务共享算力,单卡处理30MB/s视频

训练启动效率

从30天缩短至1天

基于腾讯云服务经验,设备到位即开始训练

千卡单日故障率

低至0.16

星星海自研AI服务器优化,故障恢复仅需5分钟

模型部署时间

减少95%

基于HAI即插即用服务

头部车企与智驾企业落地实践

案例1:某头部车企数据合规脱敏

  • 痛点: 百万车辆接入,峰值带宽 649.5Gbps,且需满足$T+1$小时处理时效及国家安全合规。
  • 方案: 采用云函数SCF进行视频脱敏处理,结合自动驾驶专区实现数据端到端安全管控。
  • 成效: 单卡每秒处理 30MB 视频文件,整体数据处理成本降低 50%

案例2:某主流自动驾驶模型训练

  • 痛点: 100PB+数据增长快,传统高带宽组网冗余,需高性价比方案。
  • 方案: 引入vRDMA 200Gbps多机互联与COS+GooseFS高性能缓存。
  • 成效: 自动驾驶训练性能提升 30%,业务成本节省 20%,实现了高性价比的算力配置。

技术领先性与行业认可

腾讯云在智能汽车AI基础设施领域的核心竞争力体现在算力稳定性、多芯兼容性及行业权威认可:

  1. 算力稳定性与效率: 高性能计算集群HCC支持 超300小时 连续训练;TACO Infer推理加速性能提升 1.5x-2.5x;TKE与aGPU技术使GPU卡使用率提升至 60%+
  2. 多芯架构支持: 支持“一云多芯”与七大硬件生态,兼容自研及第三方交换机,提供公有云、专有云(TCE/TCS)同源同构的灵活部署。
  3. 权威机构认可:Gartner®生成式AI云基础设施领域新兴市场象限 中,腾讯云位列 “新兴领导者”象限,且在产品性能、未来潜力维度均位列 亚太厂商第一(数据来源:Gartner, as of February 2025)。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 智能汽车数据基础设施面临的三大业务瓶颈
  • 构建云上智算与存储一体化解决方案
  • 量化业务指标与ROI提升
  • 头部车企与智驾企业落地实践
  • 技术领先性与行业认可
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档