特斯拉AI Day：最不务正业的，或许是造车了

文章来源：企鹅号 - 踢车帮

特斯拉搞AI Day，尽揽人才或比“秀肌肉”更务实。

特斯拉为什么要搞AI Day？马斯克说的很明白，这就是一场招工宣讲会，“秀肌肉”是其次，能把人才招进来才最重要。所以，在这场“千呼万唤始出来”的宣讲会上，技术讲解都挺硬核的，一般人不太好消化，但仍然不妨碍我们“删繁就简”，去理解一番特斯拉的AI大业。特斯拉主要讲了3件事：Optimus人形机器人、FSD自动驾驶、Dojo超级计算机。

钢铁打工人：Optimus人形机器人

在去年的AI Day上，特斯拉就说过，他们要造人形机器人。不过，去年上台的“机器人”，其实是真人假扮的。今年，“机器人原型机”终于露面了。它有点摇摇晃晃，慢慢吞吞，传感器、线束裸漏在外，也没有漂亮的皮肤，果然是“初生牛犊”。

我们不禁好奇，特斯拉为什么要做人形机器人？一家造车的公司，能造好机器人吗？其实，在特斯拉的价值观中，“人是最灵活的架构”。在我们生活的世界里，有很多工具，也是为人体量身打造的。试想一下，我们是让每一个工具都具备自动控制能力更容易，还是直接设计出一个“人形机器人”操纵工具更现实？如果这个“人形机器人”能做好，那很显然，后者的建议更合理。

再扩大一点讲，我们投入大量的资本、精力去研究自动驾驶，以及仿真机器人，就是为了“取代人”。一方面，未来的人口走向老龄化，数量必然是减少的，有些工作都找不到人来做；另一方面，有一些重复、枯燥、危险的工作，也不适合人来做，不妨交由机器人替代。而从“试水”的难度上讲，具备自动驾驶能力的汽车，或许是最简单的机器人了。但很显然，特斯拉的“野心”绝不局限在汽车本身。自动驾驶的汽车是“前菜”，仿真机器人才是“大餐”。自动驾驶也不可能白研究，这次亮相的Optimus人形机器人就用上了很多汽车的技术。

看这张结构图，橙色部分是人形机器人的驱动器，相当于汽车的电机；绿色部分是电池、电气系统，保证供电以及控制决策，相当于汽车的电池包、车载计算单元。机器人所用电池包是2.3kWh、52V，布置于胸口的位置。计算单元高度集成化，包含了通讯模块、语音模块、充电管理模块、多类传感器和冷却系统等，同样在胸口的位置。电动汽车会专门保护电池包、计算单元，为之设计溃缩区域、吸能框架。这款机器人也设计了“不慎摔倒后”优先保障电池包、计算单元的措施。

汽车完成自动驾驶，要识别障碍物、规划路径，并且驱动执行。人形机器人要移动，并且完成动作，与自动驾驶很类似。比如，Optimus人形机器人主要靠视觉感知，判断出周围障碍物，和特斯拉汽车的感知逻辑很像；机器人靠电机驱动，不仅要看能否实现规定动作，也要注意耗能问题，这和汽车一样，非常在意百公里电耗；机器人的动作自由度更高，循迹轨迹也就更复杂，前后移动、正逆转动，以及一些弯腰、跳跃的动作，复杂度确实超过了仅可前后左右移动的汽车。

我们可以说，Optimus人形机器人就是在做“更复杂的自动驾驶”，有借鉴汽车的地方，更有难度几何倍数增长的地方。目前，Optimus人形机器人的控制水平确实有点低能，还需要较长的发育时间。

类似激光雷达：FSD自动驾驶

回顾一下，去年的AI Day讲了“FSD如何感知世界”，今年的AI Day则讲了“FSD如何规划和控制”。对于自动驾驶，特斯拉有自己的独到理解。在感知层面，他们希望做得更纯粹，不需要太多的传感器，最好只用摄像头就行。有观点说，这是为了节省成本。如果和搭载激光雷达的方案相比，兴许可以节省很多钱，但毫米波雷达、超声波传感器的成本并不高（单个价格几十块），单纯为了降本的意义并不大。只能说，和成本控制有关系，但绝不是全部因素。特斯拉更考虑到的，最好绕开不同传感器之间的信号融合问题。

纯视觉路线，接收到的仅有图像信息；但引入了毫米波雷达、激光雷达后，收到的感知信号更多，种类也比较复杂，谁的优先级高，到底该信谁，需要额外的算法支持、算力支持。今年的AI Day，特斯拉狠狠地秀了一波纯视觉方案，特别花大篇幅介绍了新的算法和技术，最终要实现“类似于激光雷达”的感知效果。众所周知，激光雷达很重要的一点是，就算“我识别不出障碍物具体是什么，但我能确定那确实是一个障碍物。”将来，FSD也会倾向于此，周围8个摄像头捕捉画面，即便遇到没见过的障碍物，不知道具体是什么，但仍然可以识别出是障碍物，“该绕道而行”。要真达到上述效果，算法实在太重要的。当然，是不是吹牛，得看真实路况的“疗效”。

有人担心，仅用摄像头，是不是存在误识别、漏识别的问题？所以，这两天，当特斯拉声称砍掉超声波传感器、毫米波雷达的时候，质疑的声音很多，这都很正常。我的看法是这样的。超声波传感器主要为了泊车，影响不算很大。毫米波雷达舍弃也就舍弃了，因为毫米波本来就容易误判，前面有个易拉罐，都可能被认为是一堵高墙，在融合过程中，其信号识别很多时候是被抛弃的。但为了更安全，解决办法是什么？要么，就是提高算法和技术，把摄像头的视觉识别做好；要么，就是升级到4D毫米波雷达，或者激光雷达。特斯拉目前选择前者，国内多数车企选择后者。前者的路，没人知道能不能走成。其实，特斯拉偶尔也会摇摆，时不时传出过，特斯拉有4D毫米波雷达的专利出现，或者有激光雷达的原型车亮相。还是那句话，最后看实际能力。

回头看看，特斯拉做自动驾驶的“资源池”是什么？是其连年倍增的用户规模。2021年，参与FSD Beta版本的用户大概2000名；到了2022年，其用户规模已经超过了16万。用户规模“爆炸”，对于自动驾驶的场景训练、版本迭代，增益太多了，加速太快了。预计，特斯拉FSD测试版将于年底前向全球推出，但北美以外的市场需要获得监管部门的批准。无论如何，期待值拉满了。

压榨训练时间：Dojo超级计算机

拥有了巨量的用户规模，产生了海量的测试数据，自动驾驶要“快马一鞭”，还需要一台具备超级处理能力的超级计算机。Dojo在日语中，其实是道场的意思，有那么一点武力修行的味道了。在AI Day上，特斯拉公布了这么一组数据：视频图像有多帧画面，需要14亿帧才能训练一个神经网络，对等需要耗费10万个GPU工时。

Dojo超级计算机就是要把训练工时大幅缩短，以前或许需要几个月，现在可以缩短到1-2周。总之，这样的计算机相当超级。特斯拉是这样介绍的：只需要四台Dojo系统机柜，就能实现等同于72个传统机架中4000个GPU所实现的自动标记性能。

预计2023年之前，特斯拉会在美国加州建造第一台Dojo ExaPod超级计算机集群，将来一共建造7个。“粮草先行”，在超级计算集群成型之后，自动驾驶模型训练可以再加速，从Beta版快速进化到量产版，而Optimus人形机器人同样也会受益。

写在最后

特斯拉不只是一家汽车公司。能源、火箭回收、超级计算、人形机器人，诸如此类，特斯拉都有涉猎，都当作改变世界的业务来做。这么看上去，造车反而是特斯拉最不务正业的选择了。

本文作者为踢车帮曹安

发表于: 2022-10-122022-10-12 11:44:26
原文链接：https://kuaibao.qq.com/s/20221012A02WRU00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

特斯拉AI Day：最不务正业的，或许是造车了

相关快讯

扫码

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐