摘要
马斯克对于计算能力的「破壁」,又将看似已经明确的智能电动车竞争,拉到了另一个维度之上。
8 月 23 日,一辆处于自动驾驶模式的特斯拉 Model 3 在美国撞上警车,险些造成巡警受伤。这是 NHTSA(美国国家公路交通安全管理局)统计特斯拉自动驾驶造成的第 12 起事故。几天之后,一封长达 11 页的信函送往特斯拉,NHTSA 要求特斯拉「好好解释」一下。
一直以来,将 L2 级别的辅助驾驶系统命名为 Autopilot 和 FSD(full self-driving)被认为是特斯拉的原罪,容易误导消费者。但马斯克信念坚定,即便事故每年都有,但就是认为 L5 级别的完全自动驾驶一定会到来。并且坚持与业界使用激光雷达力保安全的做法不同,他始终坚持「纯视觉」路线,解决 L5 级自动驾驶的问题。
当辅助驾驶能力逐渐成为新能源车的「标配」的时候,坚持「纯视觉」路线实现完全自动驾驶的特斯拉,在不久前的 AI 日上曝光了自研计算芯片 D1,由于高带宽的特性和分布式的计算架构设计,3000 块 D1 芯片组成的超级计算机集群 Dojo ExaPOD,算力将远超目前全球最快的超级计算机富岳。
这并不是马斯克一次简单的「黑科技炫耀」,实际上,智能电动车领域专业人士深受震撼,因为这意味着刚刚看起来要走向「内卷」的智能电动车战争方向,一下子从「三电」系统,转到了「算力」上,很可能会开启新造车的「升维」竞争。
特斯拉AutoPilot功能开启|特斯拉
2019 年 FSD 芯片发布的时候,特斯拉 AI 总负责人 Andrej Karpathy 说过一句话,「你开车是因为眼睛看到了路况,而不是靠双眼发射激光。」这让外界认清,在实现自动驾驶的技术路线上,特斯拉选择了纯视觉路线—摄像头堪比人眼,是自动驾驶时需要的几乎唯一传感器。
今年 5 月,特斯拉宣布北美市场的 Model 3/Y 将不会再配备毫米波雷达,原因是特斯拉采用摄像头来进行深度估算的精度已经超过了摄像头+毫米波雷达。
关于摄像头和雷达的路线之争还要回溯到 2004 年。美国国会为了在战争中减少伤亡,要求 DARPA 组织无人驾驶汽车大赛。Velodyne 正是通过这个契机,研发出激光雷达,转型成为激光雷达公司。也是在 2004 年,马斯克投资特斯拉 640 万美元,成为特斯拉董事长。
客观来看,马斯克一开始「强烈」反对激光雷达的原因在于过高的成本。2012 年一辆 Waymo 无人驾驶车的成本 15 万美元,激光雷达单颗售价 7.5 万美元,占了 50%。直到谷歌自研,2017 年才宣布将激光雷达价格打到 7500 美元。
目前激光雷达在中国市场具有高度确定性,比如蔚来、小鹏等新造车势力,以及传统车厂奥迪、宝马等都宣布应用激光雷达。一个原因在于成本下降。比如 2020 年底,华为首次发布 96 线车规级高性能激光雷达,号称要把成本压缩到 200 美元。
成本之外,安全是另外的考量因素。「中国场景跟美国完全不一样,核心目标是安全,加激光雷达能够安全就加,然后贵也贵不了多少钱。」一位新造车产品经理告诉极客公园。
当性价比不是问题,马斯克对于纯视觉的押注该如此「嘴硬」,这背后到底是出于什么考虑?
在马斯克看来,模仿人类是如何学会开车的,视觉获取信息+大脑处理信息,Autopilot 也能成为一个合格的「老司机」。即便没有激光雷达,用 Andrej 的话说,「我们大脑里的『深度学习网络』,有能力理解身边所有物体视觉深度和速度。」
Andrej 曾表示,激光雷达+高精地图(也是国内自动驾驶公司的普遍做法)的配置,需要大量的前置准备,并且保持基础硬件更新的成本太高,前期成本远高于纯视觉方案,将会「拖累」特斯拉量产的步伐。深度学习需要海量数据喂养,所以对于特斯拉来说,「规模化」无比重要。
让汽车擅长「自我驾驶」是特斯拉在 2013、2014 年就在思考的事情。前期特斯拉通过采集和仿真生产了庞大数据。每辆特斯拉装有 8 个摄像头,获取原始输入后能创建不同的分辨率,用于不同的功能和目的,最终这些信息会被输入到复杂的神经网络中,生成对自动驾驶有用的附加信息。问题在于,即便拥有 8 个摄像头,其背后的神经网络矢量空间依旧不够,换句话说,就是学习能力的成长性还是不够。
Dojo 的一个研发目标是容纳更大型的混合神经网络模型,专注于训练 Autopilot 神经网络,让其看得清楚的同时,也拥有聪明的大脑。马斯克曾在 2020WAIC 大会上表示,当下计算机视觉已经超越人类专家水平,但要保证计算机视觉实现的关键是算力的大小。
特斯拉 AI 日曝光的芯片结构|特斯拉
实际上,由 120 个训练模块,3000 块 D1 芯片组成的超级计算机集群 Dojo ExaPOD,算力将远超目前全球最快的超级计算机富岳。
发布会后,马斯克回复推特网友,ExaPOD 运算能力足以模拟人脑,下一代 Dojo 性能预计还会有 10 倍的提升,将成为世界上最强大的神经网络训练计算机。
这是 Dojo 这台具备超算能力的「破壁」武器,对纯视觉自动驾驶的意义。至此,特斯拉可以充分运用其数据节点多(在路上跑的车多)的优势,加上市值高带来的资本能力强的优势,依靠超强算力修炼算法,并最终解决别人无法解决的问题,而且还比别人更有效率。
特斯拉在技术上一直有着比较长远的布局。特斯拉放弃原有的英伟达方案之后,自研 FSD 芯片。特斯拉自动驾驶芯片负责人 Pete Bannon(从苹果挖来的芯片设计师)说,在 2016 年,大家都在增加 CPU/GPU 的算力,没有人想过自研芯片来形成超越第三方算力的方向。因为这是个成本和风险极高的事情。
作为自动驾驶的「大脑」,自动驾驶算力已经是车厂的必争之地。
今年 1 月,蔚来发布的 ET7 搭载蔚来超算平台 NIO Adam,据李斌介绍 NIO Adam 总算力高达 1016 TOPS,超过 7 个 Tesla FSD 的算力总和。「拼马力,更要拼算力。马力+算力,是定义高端智能电动汽车的新标准。」李斌直言。
一位智能电动车圈的产品经理表示,很显然,如果特斯拉没有算力上的「破壁」,大家都用业界的普遍方案,最后算力上的差距不会太大。但特斯拉今天 Dojo 做的事情一明确,这对于国内车企来说,是基本上无法跟进的。「今天看国内的车企就像看两三年前的特斯拉,关注点还到不了超算能力的自研突破上,而是销量,车的功能做得好不好。」
「马斯克发布的其实是一条『路』——是个超级牛的基础设施。即便国内使用激光雷达,但也需要视觉,更需要计算力的提升。对于这种算力基础设施的领先,当然是带来巨大竞争优势的。」
但是特斯拉今天为什么能这么做呢?因为他的车已经足够多了,算法也通畅了,这套系统可以帮它把数据处理效率变得更高。而后来者还没有到达这个阶段,这不只是决心和财力的问题,实际上是特斯拉在充分利用自己目前的优势,想拉开和后来者的距离。
特斯拉Model S Plaid取消了物理挡杆|特斯拉
集度汽车 CEO 夏一平曾经表示,「特斯拉等公司很值得人尊重,因为他们开创了一个电动化的时代,真正推动了电动汽车的普及。」近两年产业关注重点从燃油车的核心零部件发电机与动力总成(两者成本在一辆燃油车里的成本占比大概是 15%-20%)转移到三电——电池、电控和电机。
那么这次 Dojo 的出现,也很可能意味着新造车行业游戏可能又变了。追赶者本来感觉已经可以望其项背的状况,一下子又被特斯拉的「升维」打乱了。
不久前,马斯克在全球员工大会上说,预计本季度末将迎来交付浪潮,这个月将成为公司有史以来最疯狂的一个月。对于特斯拉的销量不需要担心,可以说,它正迎来历史红利期最强的时候。在这个时候,马斯克的 Dojo,简直就是在跑得最快的时候,又给自己加了个火箭助推器,准备上天。
与此同时,马斯克还告诉员工另外一个消息,期望在 2023 年推出价值 2.5 万美元的「Model 2」(有传也可能叫 Model Q),并表示该车型可能不会配备方向盘或踏板。虽然按照包括特斯拉在内的自动驾驶厂商的技术进展,专业人士都认为在 2023 年实现完全自动驾驶的可能性几乎不存在,但马斯克似乎永远会提醒业界,「我可不这么认为!」
当然,Dojo 是否真的能按照马斯克的设想完成自动驾驶技术的「破壁」,今天只是一个可能性的展现。甚至,围绕算力而投入的巨大成本,如果不能根本性地超越其他技术路线,也会给特斯拉带来巨大的损失。
但马斯克站在一个历史最好的发展状态下,做了一个「正常公司」很难作出的决定,最终的目的,还是要塑造支撑其「非常公司」的未来技术壁垒。
这既是他的天生骄傲,也是他的精明计算。
图片来源:特斯拉
责任编辑:靖宇
本文由极客公园 GeekPark 原创发布
领取专属 10元无门槛券
私享最新 技术干货