首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

特斯拉AI Day:最不务正业的,或许是造车了

特斯拉搞AI Day,尽揽人才或比“秀肌肉”更务实。

特斯拉为什么要搞AI Day?马斯克说的很明白,这就是一场招工宣讲会,“秀肌肉”是其次,能把人才招进来才最重要。所以,在这场“千呼万唤始出来”的宣讲会上,技术讲解都挺硬核的,一般人不太好消化,但仍然不妨碍我们“删繁就简”,去理解一番特斯拉的AI大业。特斯拉主要讲了3件事:Optimus人形机器人、FSD自动驾驶、Dojo超级计算机。

钢铁打工人:Optimus人形机器人

在去年的AI Day上,特斯拉就说过,他们要造人形机器人。不过,去年上台的“机器人”,其实是真人假扮的。今年,“机器人原型机”终于露面了。它有点摇摇晃晃,慢慢吞吞,传感器、线束裸漏在外,也没有漂亮的皮肤,果然是“初生牛犊”。

我们不禁好奇,特斯拉为什么要做人形机器人?一家造车的公司,能造好机器人吗?其实,在特斯拉的价值观中,“人是最灵活的架构”。在我们生活的世界里,有很多工具,也是为人体量身打造的。试想一下,我们是让每一个工具都具备自动控制能力更容易,还是直接设计出一个“人形机器人”操纵工具更现实?如果这个“人形机器人”能做好,那很显然,后者的建议更合理。

再扩大一点讲,我们投入大量的资本、精力去研究自动驾驶,以及仿真机器人,就是为了“取代人”。一方面,未来的人口走向老龄化,数量必然是减少的,有些工作都找不到人来做;另一方面,有一些重复、枯燥、危险的工作,也不适合人来做,不妨交由机器人替代。而从“试水”的难度上讲,具备自动驾驶能力的汽车,或许是最简单的机器人了。但很显然,特斯拉的“野心”绝不局限在汽车本身。自动驾驶的汽车是“前菜”,仿真机器人才是“大餐”。自动驾驶也不可能白研究,这次亮相的Optimus人形机器人就用上了很多汽车的技术。

看这张结构图,橙色部分是人形机器人的驱动器,相当于汽车的电机;绿色部分是电池、电气系统,保证供电以及控制决策,相当于汽车的电池包、车载计算单元。机器人所用电池包是2.3kWh、52V,布置于胸口的位置。计算单元高度集成化,包含了通讯模块、语音模块、充电管理模块、多类传感器和冷却系统等,同样在胸口的位置。电动汽车会专门保护电池包、计算单元,为之设计溃缩区域、吸能框架。这款机器人也设计了“不慎摔倒后”优先保障电池包、计算单元的措施。

汽车完成自动驾驶,要识别障碍物、规划路径,并且驱动执行。人形机器人要移动,并且完成动作,与自动驾驶很类似。比如,Optimus人形机器人主要靠视觉感知,判断出周围障碍物,和特斯拉汽车的感知逻辑很像;机器人靠电机驱动,不仅要看能否实现规定动作,也要注意耗能问题,这和汽车一样,非常在意百公里电耗;机器人的动作自由度更高,循迹轨迹也就更复杂,前后移动、正逆转动,以及一些弯腰、跳跃的动作,复杂度确实超过了仅可前后左右移动的汽车。

我们可以说,Optimus人形机器人就是在做“更复杂的自动驾驶”,有借鉴汽车的地方,更有难度几何倍数增长的地方。目前,Optimus人形机器人的控制水平确实有点低能,还需要较长的发育时间。

类似激光雷达:FSD自动驾驶

回顾一下,去年的AI Day讲了“FSD如何感知世界”,今年的AI Day则讲了“FSD如何规划和控制”。对于自动驾驶,特斯拉有自己的独到理解。在感知层面,他们希望做得更纯粹,不需要太多的传感器,最好只用摄像头就行。有观点说,这是为了节省成本。如果和搭载激光雷达的方案相比,兴许可以节省很多钱,但毫米波雷达、超声波传感器的成本并不高(单个价格几十块),单纯为了降本的意义并不大。只能说,和成本控制有关系,但绝不是全部因素。特斯拉更考虑到的,最好绕开不同传感器之间的信号融合问题。

纯视觉路线,接收到的仅有图像信息;但引入了毫米波雷达、激光雷达后,收到的感知信号更多,种类也比较复杂,谁的优先级高,到底该信谁,需要额外的算法支持、算力支持。今年的AI Day,特斯拉狠狠地秀了一波纯视觉方案,特别花大篇幅介绍了新的算法和技术,最终要实现“类似于激光雷达”的感知效果。众所周知,激光雷达很重要的一点是,就算“我识别不出障碍物具体是什么,但我能确定那确实是一个障碍物。”将来,FSD也会倾向于此,周围8个摄像头捕捉画面,即便遇到没见过的障碍物,不知道具体是什么,但仍然可以识别出是障碍物,“该绕道而行”。要真达到上述效果,算法实在太重要的。当然,是不是吹牛,得看真实路况的“疗效”。

有人担心,仅用摄像头,是不是存在误识别、漏识别的问题?所以,这两天,当特斯拉声称砍掉超声波传感器、毫米波雷达的时候,质疑的声音很多,这都很正常。我的看法是这样的。超声波传感器主要为了泊车,影响不算很大。毫米波雷达舍弃也就舍弃了,因为毫米波本来就容易误判,前面有个易拉罐,都可能被认为是一堵高墙,在融合过程中,其信号识别很多时候是被抛弃的。但为了更安全,解决办法是什么?要么,就是提高算法和技术,把摄像头的视觉识别做好;要么,就是升级到4D毫米波雷达,或者激光雷达。特斯拉目前选择前者,国内多数车企选择后者。前者的路,没人知道能不能走成。其实,特斯拉偶尔也会摇摆,时不时传出过,特斯拉有4D毫米波雷达的专利出现,或者有激光雷达的原型车亮相。还是那句话,最后看实际能力。

回头看看,特斯拉做自动驾驶的“资源池”是什么?是其连年倍增的用户规模。2021年,参与FSD Beta版本的用户大概2000名;到了2022年,其用户规模已经超过了16万。用户规模“爆炸”,对于自动驾驶的场景训练、版本迭代,增益太多了,加速太快了。预计,特斯拉FSD测试版将于年底前向全球推出,但北美以外的市场需要获得监管部门的批准。无论如何,期待值拉满了。

压榨训练时间:Dojo超级计算机

拥有了巨量的用户规模,产生了海量的测试数据,自动驾驶要“快马一鞭”,还需要一台具备超级处理能力的超级计算机。Dojo在日语中,其实是道场的意思,有那么一点武力修行的味道了。在AI Day上,特斯拉公布了这么一组数据:视频图像有多帧画面,需要14亿帧才能训练一个神经网络,对等需要耗费10万个GPU工时。

Dojo超级计算机就是要把训练工时大幅缩短,以前或许需要几个月,现在可以缩短到1-2周。总之,这样的计算机相当超级。特斯拉是这样介绍的:只需要四台Dojo系统机柜,就能实现等同于72个传统机架中4000个GPU所实现的自动标记性能。

预计2023年之前,特斯拉会在美国加州建造第一台Dojo ExaPod超级计算机集群,将来一共建造7个。“粮草先行”,在超级计算集群成型之后,自动驾驶模型训练可以再加速,从Beta版快速进化到量产版,而Optimus人形机器人同样也会受益。

写在最后

特斯拉不只是一家汽车公司。能源、火箭回收、超级计算、人形机器人,诸如此类,特斯拉都有涉猎,都当作改变世界的业务来做。这么看上去,造车反而是特斯拉最不务正业的选择了。

本文作者为踢车帮 曹安

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20221012A02WRU00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券