首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

马斯克如何带领特斯拉走上自动驾驶的新道路

今年 8 月下旬的一个星期五,埃隆·马斯克 (Elon Musk) 在特斯拉开着他的 Model S

位于帕洛阿尔托的总部,在导航屏幕上随机选择一个位置,并让汽车使用其全自动驾驶技术进行自动驾驶。在 45 分钟的时间里,他一边听莫扎特的音乐,一边直播自己的旅程,其中包括经过马克·扎克伯格 (Mark Zuckerberg) 的家,他曾开玩笑地挑战马克·扎克伯格 (Mark Zuckerberg) 来一场笼斗比赛。“也许我应该敲门,礼貌地询问他是否愿意进行肉搏战,”他笑着说道,然后让车继续行驶。

马斯克之前已经使用过 FSD 数百次,但这次的驱动器截然不同,不仅仅是因为它更平稳、更可靠。他使用的新版本 FSD 12 基于一个激进的新概念,他相信该概念不仅会彻底改变自动驾驶汽车,而且还将实现可在物理现实世界中运行的通用人工智能的巨大飞跃。这个新系统不像所有以前版本的自动驾驶软件那样基于数十万行代码,而是通过处理数十亿帧人类如何驾驶的视频来自学如何驾驶,就像新的大型自动驾驶软件一样。语言模型聊天机器人通过处理数十亿个人类文本来训练自己生成答案。

令人惊讶的是,马斯克在八个月前就让特斯拉采用了这种全新的方法。

“这就像 ChatGPT,但适用于汽车,”特斯拉自动驾驶团队的年轻成员 Dhaval Shroff 在 12 月的一次会议上向马斯克解释道。他将他们正在研究的想法与马斯克于 2015 年共同创立的 OpenAI 实验室刚刚发布的聊天机器人进行了比较。“我们处理大量数据,了解真实的人类驾驶员在复杂驾驶情况下的行为,”他说。 Shroff,“然后我们训练计算机的神经网络来模仿它。”

在此之前,特斯拉的自动驾驶系统一直依赖于基于规则的方法。汽车的摄像头可以识别车道标记、行人、车辆、标志和交通信号等。然后软件应用了一组规则,例如:红灯时停车,绿灯时走,留在车道标记的中间,仅在没有足够快的车辆冲撞你时才通过十字路口,等等。Tesla 的工程师手动编写并更新了数十万行 C++ 代码,以将这些规则应用于复杂的情况。

史洛夫和其他人正在研究的“神经网络规划器”采取了不同的方法。史洛夫说:“我们不是根据规则来确定汽车的正确路径,而是依靠神经网络来确定汽车的正确路径,该神经网络从数百万个人类所做的事情中学习。” 换句话说,这是人类的模仿。面对某种情况,神经网络会根据人类在数千种类似情况下所做的事情来选择一条路径。这就像人类学习说话、开车、下棋、吃意大利面以及几乎所有其他事情的方式一样;我们可能会被赋予一套要遵循的规则,但主要是我们通过观察其他人如何做来掌握技能。这是艾伦·图灵 (Alan Turing) 在 1950 年论文中设想的机器学习方法,

到 2023 年初,神经网络规划器项目已经分析了从 Tesla 客户的汽车收集的 1000 万个视频片段。这是否意味着它只能达到人类驾驶员的平均水平?“不,因为我们只使用人类处理良好情况时的数据,”史洛夫解释道。人工标注人员(其中许多位于纽约州布法罗)评估了这些视频并给出了评分。马斯克告诉他们寻找“五星级优步司机会做的事情”,而这些就是用于训练计算机的视频。

马斯克经常走过帕洛阿尔托的自动驾驶工作区,跪在工程师旁边进行即兴讨论。当他研究新的仿人方法时,他有一个问题:真的需要它吗?会不会有点过分了?他的格言之一是永远不应该使用巡航导弹来杀死苍蝇;只需使用苍蝇拍即可。使用神经网络是否不必要地复杂?

史洛夫向马斯克展示了神经网络规划器比基于规则的方法效果更好的例子。演示中的道路上散落着垃圾桶、倒下的交通锥和随机的碎片。由神经网络规划器引导的汽车能够绕过障碍物、越过车道线并在必要时违反一些规则。“当我们从基于规则转向基于网络路径时,就会发生以下情况,”史洛夫告诉他。“如果你打开这个东西,即使在非结构化环境中,汽车也永远不会发生碰撞。”

正是这种迈向未来的方式让马斯克兴奋不已。“我们应该进行詹姆斯·邦德式的演示,”他说,“炸弹在四面八方爆炸,不明飞行物从天而降,而汽车却疾驰而过,没有撞到任何东西。”

机器学习系统通常需要一个指标来指导它们进行自我训练。马斯克喜欢通过规定哪些指标应该是最重要的来进行管理,他给了他们指导方针:全自动驾驶汽车在没有人类干预的情况下能够行驶的英里数。“我希望每次干预的里程数最新数据成为我们每次会议的起始幻灯片,”他宣布道。他告诉他们把它做得像一个视频游戏,让他们每天都可以看到自己的得分。“没有分数的电子游戏很无聊,所以随着每次干预里程的增加,每天观看都会有动力。”

团队成员在他们的工作空间安装了巨大的 85 英寸电视监视器,实时显示 FSD 汽车在没有干预的情况下平均行驶了多少英里。他们在办公桌附近放了一个锣,每当他们成功解决导致干预的问题时,他们就必须敲响锣。

到 2023 年 4 月中旬,马斯克开始尝试新的神经网络规划器。他坐在驾驶座上,旁边是特斯拉自动驾驶软件总监 Ashok Elluswamy。自动驾驶团队的三名成员坐在后面。当他们准备离开特斯拉帕洛阿尔托办公大楼的停车场时,马斯克在地图上选择了一个停车位置,并将双手从方向盘上移开。

当汽车转向主干道时,第一个可怕的挑战出现了:一名骑自行车的人朝他们驶来。汽车本身就会屈服,就像人类所做的那样。

汽车在快速道路和社区街道上行驶了 25 分钟,处理复杂的转弯并避开骑自行车的人、行人和宠物。马斯克从未碰过方向盘。只有几次,当他认为汽车过于谨慎时,例如当汽车在四向停车标志处过于恭顺时,他才会通过敲击油门进行干预。有一次,汽车进行了一项他认为比他本来会做的更好的动作。“哦,哇,”他说,“即使我的人类神经网络在这里失败了,但汽车却做了正确的事情。” 他非常高兴,开始吹口哨吹莫扎特的G大调小夜曲“小夜曲”。

“伙计们,干得很棒,”马斯克最后说道。“这确实令人印象深刻。” 然后他们都参加了 Autopilot 团队的每周例会,会上有 20 名几乎都穿着黑色 T 恤的人围坐在会议桌旁聆听裁决。许多人不相信神经网络项目会起作用。马斯克宣称他现在是一名信徒,他们应该动用资源来推动这一计划的发展。

在讨论过程中,马斯克抓住了团队发现的一个关键事实:神经网络只有在接受至少一百万个视频剪辑的训练后才能正常工作。这使特斯拉相对于其他汽车和人工智能公司具有巨大优势。它在世界各地拥有近 200 万辆特斯拉的车队,每天收集视频片段。“我们处于独特的位置来做到这一点,”埃勒斯瓦米在会议上说。

四个月后,新系统已准备好取代旧方法,并成为 FSD 12 的基础,特斯拉计划在监管机构批准后立即发布 FSD 12。还有一个问题需要克服:人类驾驶员,即使是最优秀的驾驶员,通常也会篡改交通规则,而新的 FSD 在设计上就模仿了人类的行为。例如,超过 95% 的人会缓慢地爬过停车标志,而不是完全停下来。美国国家公路安全委员会负责人表示,该机构目前正在研究是否也允许自动驾驶汽车这样做。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OPel_CK9TBmf9K4O2xGzc-Vw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券