李想在AI Talk 第二季上表示理想汽车智能驾驶发展有三个阶段。第一阶段,依赖机器学习感知与规则算法的分段式辅助驾驶方案,需高精地图和既定规则支撑,类似蚂蚁通过简单规则完成任务。百万级参数限制使其只能应对有限场景,需不断添加限定规则,形成“有轨交通”式自动驾驶模式,比较初级。
第二阶段,通过端到端大模型学习人类驾驶行为(如马戏团训练动物),能基于三维图像判断速度与轨迹,应对泛化场景。但对物理世界的理解仍不足,需结合视觉语言(VLM)模型辅助处理复杂交通环境,仍难以解决罕见或高度复杂问题。
第三阶段,VLA阶段可利用3D与2D视觉构建真实物理世界,不仅能解读导航逻辑,还具备类似人类的推理能力。其“脑系统”可深度理解物理环境,支持复杂动作执行,实现真正类人级别的自动驾驶,被称为“司机大模型”。
理想汽车正式迈入VLA的阶段,智能驾驶行业即将迎接黎明的到来。更安全、更智能,并且它还兼顾了Orin-X和Thor-U芯片,普惠更多理想用户。也让我们共同期待VLA的上车,也许那是一次革命性的时刻。