前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >自动驾驶卷入3.0时代!风起毫末,燎原上海车展

自动驾驶卷入3.0时代!风起毫末,燎原上海车展

作者头像
量子位
发布2023-05-06 14:10:28
1630
发布2023-05-06 14:10:28
举报
文章被收录于专栏:量子位
贾浩楠 发自 凹非寺 量子位 | 公众号 QbitAI

2023上海车展,在各方期待中开启。

一方面新能源车型、新智能化体验,眼花缭乱,但另一面是百年汽车工业变革迎来最重要的分水岭、转折点——智能汽车的“安卓时刻”已经到来

“自动驾驶3.0时代”、“Transformer+BEV”、“重感知、轻地图”、“GPT上车”……

伴随国内自主玩家对汽车智能化,特别是智能驾驶的猛烈冲击,新的技术、名词一下涌现出来。不过仔细梳理过去几年的发展,会发现这些趋势并非偶然。

相应的AI技术、思路、理念,早有行业前瞻性玩家呼吁和验证,并且一直在践行推进,比如有“自动驾驶量产第一”之称的毫末智行。

智能车,在朝什么方向卷

所谓智能汽车的“安卓时刻”,从现象上看,早有踪迹可寻。

首先是在智能驾驶的功能、方案配置上,L2智能驾驶逐渐成为标配

L2智驾功能开始向15w左右入门的车型渗透,代表着占汽车消费市场绝大多数的用户,可以享受智能驾驶带来的便捷,也就同时有更多机会挖掘智能座舱的功能。

其次是感知算法上,重感知、去高精地图技术路线正在成主流。这也让视觉感知的重要性进一步上升。

第三点,AI模型上收敛到Transformer架构。起源自NLP领域、以Transformer为代表的大模型开始被引入到自动驾驶系统的研发中。

最后,在AI装置层,超大算力的智算中心成为标配。几乎所有自研玩家都走上了自建超算基础设施的道路,预先储备日后5-10年算力需求。

所以,本届车展上,理想提出智能汽车已经进入3.0时代,标志是智能驾驶能力延伸到了城市场景,摆脱对高精地图的依赖,像人类司机那样实时地感知、决策、规划。

而且“重感知”的提法,今年更是成为主流声音。包括小鹏、华为、百度等等重要玩家,都开始强调视觉感知算法。

谈到重感知,几乎所有的自动驾驶团队,都在说这两个词:BEV、Transformer。

几乎所有玩家都达成了一个共识,自动驾驶量产落地,目前必须通过规模化性价比的路线迈出第一步。

这样的的认知,有些玩家是在与主机厂的磨合中获得认知,有的则是在无人驾驶方向上碰壁后寻找的新出路。

但与众不同的是,3年前这样的趋势就已经有迹可循,并且有人一直在践行。

背后的玩家,是行业内被称为“量产自动驾驶第一名”的——毫末智行

毫末做了什么?

自动驾驶行业内,3年以来一直有这样一个神奇的现象:

毫末智行总是先人一步探索实践AI技术的最前沿,无论是BEV、大模型、重感知…而后行业的发展方向总是能证明,毫末是对的。

按照时间线划分,毫末智行率先实践的理念和技术依次为:

  • 2021年3月,提出自动驾驶三定律:从低速到高速,从载物到载人,从商用到民用。
  • 2021年6月,国内第一个探索将Transformer大模型落地应用到自动驾驶产品中。
  •  2021年12月,率先发布中国首个自动驾驶数据智能体系MANA(雪湖)。
  • 2022年4月,率先发布行业首个基于“重感知,不依赖高精地图”技术的城市NOH。
  • 2022年4月,国内首家研发落地BEV感知技术。
  • 2022年9月,率先提出自动驾驶3.0时代概念。
  • 2023年1月,建成国内首个自动驾驶行业最大的智算中心MANA OASIS(雪湖·绿洲),浮点运算每秒67亿亿次。
  • 2023年1月,率先发布视觉自监督大模型、3D重建大模型、多模态互监督大模型、动态环境大模型、人驾自监督认知大模型等五大模型。首次将GPT大模型技术引用到自动驾驶认知模型训练。
  • 2023年4月,正式发布行业首个自动驾驶生成式大模型DriveGPT,重塑汽车智能化技术路线。

今天业内几乎所有达成共识的观点,毫末几乎都在1-2年时间前进行了验证。

的确令人惊奇。

但回溯毫末的历史,不难发现这些现象都是必然。

毫末成立之初,确定了公司战略:利用成本和规模的优势,使用数据智能,逐步落地自动驾驶产品。

这是毫末一直以来贯彻的“第一性原理”,一切的决策都是为这个原则服务。

成立之初:做什么样的自动驾驶

2021年3月毫末首提自动驾驶商业发展三定律——「从低速到高速,从载物到载人,从商用到民用」。

三定律折射出的是毫末对于做自动驾驶的态度:「可行、可靠、可商用」,而且是渐进式落地。

而在推进量产落地的过程中,毫末智行自然而然意识到以AI为主的算法,必须有大量数据输入迭代反馈组为前提,才有可能达到商用的可靠性。

所以,毫末提前“预知”大模型的重要性,并且在2021年6月(国内)率先开始探索将Transformer大模型落地自动驾驶产品。

而从自动驾驶技术的客观规律和因果性出发,毫末随后的一系列前瞻性举动,其实都是围绕“大模型大数据”的核心展开。

比如,紧随Transformer而后的,是2021年12月发布的国内首个完整的数据智能体系MANA。MANA雪湖对于自动驾驶研发的意义,是一套完整的技术体系。

由通用基础服务、核心算法原型(感知、认知、地图以及仿真系统)、数据驱动系统、数据可视化系统组成,提供全局的数据洞察等能力并且提供车辆管理、平行驾驶等平台工具。

MANA对于自动驾驶和新的感知、认知、自动标注、自动验证等等环节全部覆盖。

“基础设施”问题解决好以后,毫末的速度开始展现。

快速发展期:大模型威力初显

2022年4月,毫末率先发布行业首个基于“重感知”技术的城市NOH。这也是行业内第一次公开提出“去高精地图依赖”的路线。

与其他玩家在落地过程中遭遇挫折寻求改变不同的是,毫末CEO顾维灏一开始就意识到了高精地图的“掣肘”之处:除了在政策准入方面会拖慢落地进度,更重要的是它在地图采集维护的成本和实时性上永远无法满足量产要求。

所以在提出重感知轻地图路线的同时,毫末还首次在国内首次公布了BEV Transformer感知技术的细节。

通过自研的BEV Transfomer,毫末智行在城市道路上实现了多传感器融合车道线识别,对自车姿态的容忍度更高,减少了车道线的抖动;面对城市环境复杂路面,纵向误差上能够表现更好,对于路面起伏的鲁棒性也更高。多相机之间相互的辅助,还扩充了检测视野,相比之前的融合跟踪方法,响应更快。

这对于城市领航辅助的量产落地,至关重要。现在成了几乎所有自动驾驶自研玩家的必修课。

2022年9月,随着对大模型应用的逐渐深入,毫末智行又首次在行业内提出“自动驾驶3.0时代”的概念,明确了以数据规模作为划分标准,并且强调了大模型和可解释的理念,现在看起来这个趋势更加明显:

最早的硬件驱动方式,称为自动驾驶的1.0时代;最近几年的软件驱动方式,称为自动驾驶的2.0时代;即将很快发生,并将持续发展的数据驱动方式,称为自动驾驶的3.0时代。

自动驾驶里程由硬件驱动、软件驱动时代的百万公里、上千万公里,直接飙升至1亿公里以上。

毫末所有的预判,无论是率先引入Transformer大模型、BEV、建设数据智能体系MANA、等等,都是在为3.0时代做准备。

因此,毫末顺理成章成为了国内第一个建成智算中心MANA OASIS(雪湖·绿洲)的自动驾驶公司,浮点运算每秒67亿亿次,为今后5-10年的算力需求提前做好了储备。

毫末智行在技术上的前瞻布局,也在实际商业落地上获得了丰厚的回报——用户累计使用里程超4000万公里,落地数十款量产车型。

2023年这个节点上,智能驾驶在性能和成本的平衡上,有了新的突破,促成这一进展的原因,是在研发上新技术的落地让算法能力快速进步。

近期,在实现自动驾驶路线之争上,比亚迪董事长王传福炮轰“无人驾驶”,等于将这一争论摆在公众层面。

实际来看,自动驾驶达到成熟的无人驾驶会是一个长期过程,但通过自动驾驶技术升级方式,从辅助驾驶走向完全的自动驾驶,已经成为全行业公认的实现路径。

之前关于自动驾驶路线、方案的所有的争论分歧几乎都统一到下面几点共识上:

首先无论从法规还是技术层面,L2商业落地一定比L4更快。

其次,智能驾驶技术需要重感知轻地图。而在这个基础上,虽然纯视觉方案还没法十全十美,一段时间内多模态融合感知方案仍然是高阶功能落地的必须。

但这样的发展趋势,另一个侧面展现的是L2/L2+功能,现在可以用较轻的传感器、算力方案实现,具备了向大众化市场普及的条件。

第三,国内用户对于智能驾驶的反馈,由“尝鲜”变成对性价比、产品价值的权衡,说明市场需求出现了本质的变化,智能车区别于传统功能车,这个概念已经深入人心。

而在对自动驾驶最重要的数据迭代层面,量变到质变的门槛也越来越近。

3.0时代自动驾驶的该走什么样的方向和路线?毫末智行也刚刚给出了自己的判断和参考。

自动驾驶3.0时代是什么?

2023年1月,毫末智行率先发布视觉自监督大模型、3D重建大模型、多模态互监督大模型、动态环境大模型、人驾自监督认知大模型等五大模型。

这是行业内首次将GPT大模型技术引用到自动驾驶认知模型训练。

而十多天之前,毫末智行又正式发布行业首个自动驾驶生成式大模型DriveGPT。

3.0时代的第一步棋,毫末给出的参考是——类GPT技术“上车”。

毫末的逻辑是,生成式大模型的思路在目前阶段,既可以率先应用在认知决策模块,不断学习认知系统的拟人化驾驶风格,形成驾驶决策优化,又可以在仿真训练环节大大提高高价值数据密度,大幅提高自动驾驶算法在感知侧的迭代效率。

而之后逐渐将DriveGPT大模型应用到自动驾驶的各个模块,实现感知、认知的端到端打通。

大模型大算力能力带来的自动驾驶技术飞跃式的发展,这一波浪潮最先触及用户端的,几乎可以肯定就是端到端的自动驾驶技术开始普及。

毫末智行所开先河,可能重塑传统的汽车智能化技术路线。也有可能是以计算机视觉技术为主的自动驾驶行业,一直盼望的属于自己的“ChatGPT时刻”。

车展前后,类GPT技术上车,我们看到了更多的蛛丝马迹。无论是座舱还是智驾,生成式大模型的价值被越来越多的玩家挂在嘴边,而有实力的,已经开始实践。

星星之火,是可以燎原的。

汽车工业百年大变革下,新的一轮竞速,谁最有可能先到终点?

这次车展之后,可能不会再有疑问了。

—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-04-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 智能车,在朝什么方向卷
  • 毫末做了什么?
    • 成立之初:做什么样的自动驾驶
      • 快速发展期:大模型威力初显
      • 自动驾驶3.0时代是什么?
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档