全局思考,无人驾驶冠军亲述算法经验

作者 | Just

出品 | AI科技大本营

视觉是无人驾驶汽车的勘探物理世界的非常重要的“器官”。在它背后,考验的则是机器算法能力。

无人驾驶技术的算法包括感知、定位、预测、决策、控制等层面,而在由创新工场、搜狗、美团点评、美图公司联合主办的 AI Challenger 2018 全球 AI 挑战赛中,无人驾驶赛道的题目就是最基础的视觉感知,所有参赛队伍需要解决如何通过视觉传感器看到的数据,来感知判断出障碍物、路标、汽车限速以及红绿灯等维度的问题。

在近日的总决赛颁奖礼上,美团点评首席科学家夏华夏称,由于视觉感知有上述诸多不同的识别维度,那在工程层面不可能对每项任务都做一个模型出来,最好的方案是由一个模型可以同时用视觉信号找到多种识别目标,但这并不容易。

根据大赛规定,此次自动驾驶赛道的评判标准分为两部分,一是准确度,二是速度,后者在实验室研究中很容易忽略,更具体来说,在测试和实际运行时,很少有参赛队伍在比赛前考虑能否实现实时性检测的问题。体现在算法上,关键的是要平衡算法执行效率和性能。

在历时 3 个多月,经过数轮比赛角逐后,来自中科院自动化所 SeeLess 团队最终斩获了这一赛道的冠军。那么,他们是如何让算法发挥了最佳效果?

首先在数据上,主办方给无人驾驶的赛道数据量约 1.2 亿张,其中 10 万张属于标注数据。冠军成员中的博士研究生赵旭在接受 AI科技大本营采访时称,标注数据中大约有 7 万张是优质数据,他们验证了 1 万张图片数据,2 万张在测试时使用,剩下的则是未标注数据,他们用了自动化方法来处理这些数据。赵旭认为,庞大的数据量对训练算法性能非常重要。

而在算法层面,执行效率分为两部分:算法实现复杂度和工程实现的优化。基于此,他们同时做了几个方案,另一冠军成员朱优松在颁奖礼上举例称,就车道线行驶区域的判别以及道路上的物体检测两大任务,他们使用了同一模型来实现,以降低算法实现的复杂度,同时他们把神经网络进行压缩,并使用了“老师教学生(大模型教小模型)”的方法。

而工程实现上他们注重细节,不断调整优化,比如就可行驶道路区域分割问题,仅使用底层的计算机视觉特征并不足够,他们还因此引入了一些全局特征,此外还将 GPU 并行做到极致,如此才达到了很好的效果。

“全局思考”是赵旭对这次比赛的经验性总结,当然,基础研究更要考虑工程实践具体情况的观点也尤为重要。

创新工场人工智能工程院执行院长王咏刚评价 SeeLess 团队的成绩时表示,他们在保持识别精度的同时识别性能也远超其他团队,在算法和工程的结合度上远超预计,这代表未来不同的硬件平台都可以利用先进的无人驾驶技术。

不过,视觉感知只是做无人驾驶的一个切面,要做好它需要考虑对技术栈的综合应用,这包括很多软硬件的能力。美团点评首席科学家、无人配送部总经理夏华夏认为,全场景下的无人驾驶技术应用还有很远的距离,感知、定位、预测、规划、控制每一方面都极具挑战,如果要预估什么时候人们能普遍做上无人驾驶汽车,“十年之后”是他给出的一个非常乐观的期限。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181223A0RGMZ00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券

玩转腾讯云 有奖征文活动