首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何证明自己才是智驾之王?

文|Karakush

如题。

对于小鹏而言,是眼下比真正成为智驾之王更难的问题。

2023年中国汽车智驾圈列强林立。

前有华为遥遥领先,喊出到年底全国都能开上高阶智驾;后有理想“提权重”、“上强度”,年底通勤NOA落地100城;最近还有极越,直接甩掉激光雷达,用纯视觉技术方案跑通上海城区领航辅助。

面对中国智驾,特斯拉都是笑话——至少在国内道路上并不好反驳。

而原本以智驾立命的小鹏,在友商衬托下,从技术第一“落到”技术第一梯队。耐住寂寞科研八年,友商却集体在第八年直接起立。小鹏想必是心有不甘的。

于是在年度1024科技日,何小鹏频发引战名场面,比如:

- 我们不太喜欢用民间小视频展示智能驾驶功能,然后喊遥遥领先,我们更希望扎实地做好技术。

而当被正经问起如何看待华为入场的竞争环境,何小鹏话锋转婉,“这是一个配合”:

- 行业里面,一般老大、老二PK,老三、老四挂了。我们有些人负责吆喝,让大家关注起来;有些人负责干活,把东西干好,再把客户拿过来。我觉得这个配合是天作之合。

婉了,但是不多。突出一个喧嚣烟尘里,哥们儿才是真·臭搞技术的那一个。

着急亮明身份的B面,是底气,也是焦虑。

如今对外解释智驾牛B的成本水涨船高。仅仅一年前,具备城区智驾能力并进行有限落地推送,即是跻身头部的标志。

到今年上半年,头部狂卷城区领航辅助开城数量,量大者昌;下半年开始,开城竞速进入白热化,华为起手梭哈全国之后,竞争细化到开城模式、可用体验、方案、架构以及成本,从根子上明确领先的差距、护城河的宽度,或者至少明确一个排位。

这大概也是小鹏通过本届1024亿吨输出最想表达的事。总结起来,关于小鹏认为自己第一在哪,大概是以下几点:

其一,“全国都能开、全程都好开”,也就是广泛、好用。这是小鹏智驾的两个OKR,也将是接下去智驾竞争的主旋律。

之前小鹏已经开通北上广深+佛山五城的城区智驾,并宣布到11月底开通至25城,12月底至50城。

此次小鹏强调自己的“开城”,不画大饼、不换概念,开城就是开城,开通城市经过严格的测试流程,确保提供安全可用、没有违章、舒适高效的体验,能力范围覆盖全国73%的路网,实质上所有路都可以开,第一逻辑优先用户价值高的、用户常开的路。

与此同时,“AI代驾”模式同步进行,它全国可用、不限范围,开启后设置起点和终点,手动驾驶一次后即可形成记忆地图,之后该路线就能启用,并且过程中持续迭代越开越好,如果遇到一些特殊场景,可以反向赋能XNGP形成先验。

这项针对单独路线/特定场景的城区智驾功能,由小鹏在上届1024首先提出,在理想叫做通勤NOA模式,在蔚来叫做用户路线模式(后者有点区别,用户不用自己跑训练,而是通过有效里程数解锁)。

区别友商以此作为开城标准,小鹏则是用来补完的,比如某些鹏友通勤必经很小、很偏的路,不在路网范围,就可以通过AI代驾定制路线完善全程体验。AI代驾的小范围测试很快就会启动,年内向部分用户推送。

通过XNGP开城铺面+AI代驾定制边角,到2024年小鹏旨在完成全国所有城区高阶智驾覆盖,主打一个四海鹏友皆可用、真可用。

其二,无图能力,这是XNGP全国哪里都能开的基础。

值得注意的是,“无图”不是完全抛弃导航地图,而是不依赖高精地图,不受限于高精地图的使用范围和更新时效,所以确切来说是“轻地图”。

小鹏也是在上届1024提出“轻地图、重感知”的方案;到本届小鹏汽车自动驾驶负责人李力耘博士宣布,“无图的战斗已经结束”。在完成工程测试验证之后,小鹏就可以按照用户覆盖率和行程需求开城全量推送。24日晚间,小鹏第一阶段“无图”城区智驾向用户开启公测。

直接好处就是开城速度是原来的20倍,成本只有原来的1/10。

其三,大模型上车,提升智驾拟人感和开发效率。

小鹏2024年的目标是实现“轻地图、全场景、轻雷达”。在初步进入城市智驾场景之后,小鹏发现代码量多出4倍,预测和规划代码量多出66倍,就意识到面向终局的架构一定是数据和模型驱动,走向逐步简化。

于是小鹏祭出XBrain架构,包括深度视觉神经网络XNet 2.0、基于神经网络的规控XPlanner、和其他模块。

XNet 2.0据称是行业首个应用大模型、具备时空理解能力的感知架构,融合动态BEV、静态BEV、和占据网络。

先说后面的三网。在1.0阶段动态BEV和静态BEV是独立的,很难处理遮挡、光照不清之类的复杂情况,融合之后具备很强的脑补处理能力,感知范围提升了200%;至于占据网络,小鹏宣布是业内精度最高、点云质量最顶,提升对于路沿、植物等等路障的理解。

整体来说,BEV+Transformer+OCC这个技术底座,头部之间是大差不差的,基本上能做出来的都做出来了。

有意思的是,小鹏引入大模型,从而具备时空理解能力,比方说可以有效理解在什么时间进入潮汐车道或者公交车专用道。目前主流城区智驾产品还不能干这个功能。

这是一个长时序模型,而不是我们常听到的通用语言模型,把ChatGPT塞到一个Orin芯片上工程太大。只是从特性上讲,模型让开车这件事情更加人性化、有记忆、聪明好用。

在规控层面,XPlanner可以结合分钟级的时序连续分析动机,依据周边环境信息及时变通,生成最佳运动轨迹。用人话解释——

比如在博弈过程中,你不只是观察者,也是参与者。你不只需要考虑你怎么做,也要考虑双方互动,比如两车相遇,我加速不让你,你会怎么办;如果你硬着头皮要并线,我该怎么办?

李力耘博士指出,在技术架构来说,这是一个很新的挑战,意味着很多模块之间的界限被模糊。它打破传统从预测到决策到规划的规则型串型,整合到一个黑盒子的生成逻辑,让各类因子有机交互达到拟人效果。

难点在于,之前的规则,现在变得难控。比如在一个路口,到底是大范围转右,还是轻轻弧度转右,不同需求、不同场景结果不一样,很难调试,因为它不是一个清晰、确定、一致的规则,它是一个环境动态的规则,影响因子非常多。

这是一个蛮有趣的事,何小鹏说,做好比绝大部分司机都要好。不过这是期望,现在还没做到。

何小鹏提出,下一个趋势,是从软件定义汽车,转向AI定义汽车。差别在于,前者是把人的视角写成规则,后者则是把机器视角的规则写进软件。比如用机器视觉的角度来训练,什么是人、什么是车,人没有这样一个训练,所以AI用机器的思维逻辑大量生成规则去指引。

过去的汽车,硬件能力占了90%甚至95%,但是在准无人驾驶领域,AI的能力更多,它将会是一个机器视角生成巨量规则组合的一个体系。

其四,是降低成本。从小鹏来看,技术能力够强,才配降本。

一是减少传感器硬成本。上面提到“轻雷达”,是小鹏第一次提出“轻雷达”方案。今年将在“小鹏最美MPV”X9上率先推出,取消两个前向角雷达,而不影响智驾能力。

降本的前提是不影响可靠性、安全性和用户体验。所以更轻的方案,何小鹏认为,目前完全纯视觉非常困难,无论如何车上都应该有一些雷达或者其他感知设备。

二是提升效率。李力耘分享了一个例子,在动态XNet刚出来的时候,这个算法用了一整颗的Orin算力,后来随着优化现在只用到1/10。

三是提升平台化和通用性。比如未来小鹏的Pro和Max版会技术同源,原本他们也和友商一样,是两套方案,因为两者相差一个关键安全领域激光雷达,以及一块Orin芯片。接下去Max的架构会移植到Pro上,一套架构实现两套能力,在高速和LCC上拉齐体验。拉齐之后,可以更放手做能力增强,分摊基数更大。

其他,还有第五代智舱系统XOS天玑,电子电气、电驱系统、整车制造方面的最新进展,以及飞行汽车和机器人两大副业。

外界最大的担心是,小鹏重操不务正业,是不是飘了?何小鹏一边主推是团队的努力,但凡分了一些心,两个项目能够干得更快;另一边笃定这些AI技术的耦合,将是无人驾驶更远的未来的一个必由之路。

从暂时的结果来看,我们似乎应该相信何小鹏的判断。两年多前小鹏第一次推出高速NGP,所有人高度怀疑智驾的可行性;一年多前小鹏遭遇产品危机,所有人再次怀疑智驾的必要性。

现在,以G6和G9来看,选择Max版本的用户占到70%。智驾正在走向主流,或者至少从边缘向历史舞台走近了一步。

何小鹏预判,拐点会在2025年出现。以三个特征为标志,第一是全域可用,特别是城市和小区;第二是价格合理,在全域可用的前提下做好价格;第三是所有的车开始标配。

过去的市场经验告诉我们,面对一个即将到来的大潮,小鹏不只是需要在技术与工程层面争冠,更是要赢在每一步的心智争夺,因为消费者只能记住the best or nothing。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OUwqJtS53FS_TKYqUQfdQXbg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券