首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

打破自动驾驶汽车和行人之间的语言障碍

为自动驾驶汽车提供了一种在路上传达意图方式的案例研究。

你走在人行道上,与Uber同时到达十字路口。司机举手离开方向盘,挥手示意你过去。一分钟后,你到达了第二个十字路口,就在另一辆车之后,司机举起他的手,告诉你他们先走。

但是当你到达下一个十字路口时,一辆自动驾驶出租车停了下来。你怎么知道它的计划是什么?是你应该先去还是它的人工智能大脑认为汽车应该先过去呢?

整个自动驾驶的世界都在问一个问题:一辆自动驾驶汽车如何告诉周围的人它在想什么?

形势

目前,大多数公司都没有解决这个问题。Alphabet的Waymo和GM的Cruise也从未公开提及过这一点,这对于两个把安全放在盈利之上的公司来说是很奇怪的。

大多数公司关心的只是他们将来能做些什么。创业公司Zoox从头开始的想法就是打造一款自动驾驶汽车(AV),而不是像Waymo或Cruise那样改装SUV。

彭博商业周刊: Zoox的原型VH1、VH2和VH4

“车辆前后的发光二极管线路会向其他司机发送信号……它的定向音响系统会发出嘟嘟声或模糊声,告诉人行横道上的行人车辆看到了他。”彭博商业周刊的Ashlee Vance写道。

通过使用外部照明,Zoox试图建立一种“照明语言”。问题是,“如何让公众了解这一新标准?"随着汽车上新颜色、闪烁模式甚至灯光的引入,人们很可能会感到慌乱,不知道发生了什么。Vance提到的“定向音响系统”也是如此。人们会理解攻击性和和平语调的区别吗? 人们抵制变革,这是事实。例如,当美国试图从英制改为公制时,几乎没有人想要学习一种新的测量系统,所以这项工作失败了。少数几个城镇的道路标志从几英里变为几公里,但从未超过这个标志。

drive.ai:一名乘客在德克萨斯州弗里斯科进入其中一辆出租车

Drive.ai是少数几家拥有公共打车服务的公司之一。事实上,他们是唯一一个让他们的车和行人交流的公司。

他们的大型橙色货车在得克萨斯州提供叫车服务,车的每一侧都装有箱子。drive . ai只显示一种语言,文本只能从某些角度阅读,因此陷入了设计问题。

以我的家乡为例:仅在纽约就有说800种语言; 英语并不是许多纽约人的主要语言。使用文本来帮助传达意图会将drive . ai锁定在特定的人口统计中。

在美国,约有2100万人有视力障碍。为了创造最大的可见度,必须进行大规模的对比。众所周知,在光天化日之下,屏幕并不能提供这样的功能,这使得眩光成为一个问题。

日产研究中心:谷歌设计中显示的幻灯片[Autonomous]

日产尚未宣布他们的汽车,但已经进行了大量的研究。结合Zoox和drive.ai的计划,日产希望使用外部照明和屏幕。回到对比的问题上来,这些灯光和屏幕必须非常明亮,尤其是在白天,才能提高车辆自身传达意图和行人意识。汽车和行人之间的这种交流形式——语言——需要更强。

当我看到这一点时,我不得不问自己,“什么样的解决方案不需要学习,但是能够对社区中的每个人都有效?"

火花

纽约市因其能源而臭名昭著。我在纽约出生长大,大家都走路很快。我们最喜欢的一句话是,“如果它是红色的,它是绿色的。"

花旗自行车非常适合纽约,让纽约人比以前更快地到达他们需要去的地方。尽管这个城市的主要交通方式是地铁,但花旗自行车在纽约越来越受欢迎。

感谢Citi Bike和Blaze

去年,Motivate公司在花旗自行车公司(Citi Bikes)的自行车篮里安装了一种激光装置,把自行车图标投射到比自己提前15英尺的人行道上(那些从此前看着手机不会抬头的行人,却会抬头看你)。这不仅在一天中的任何时候都可见,它是纽约市新生自行车道系统的完美预警系统。

虽然这种激光有它的缺点 - 它在人行道上非常不稳定而且有点小– 但它可以引发我的思考。“这可以适应AV的吗?”,“这会改变颜色吗?”,“如果这些激光器连接到电机和万向节上会发生什么?”所有的想法都立即浮现在我脑海中。

概念证明

我在Sketch上玩的时候意识到汽车可以像自行车那样使用这种技术,而且方式更好。进入Wave :汽车可以在人行道上投射一个停车图标,清楚地传达它的意图,而不是把灯变成红色,向行人发出应该停车的信号。

连接到马达上,当汽车向它行驶时,突起甚至可以停留在原位,最终“越过”突起本身。

开始准确的原型,我第一站做的是名词项目,一站式商店的图标。

名词项目的停止标志结果

由于大多数图标都是八边形,但是,我开始设计汽车在人行横道上投射停车标志的样子。我想这样,一个想要过马路的行人会看到汽车会先开,他们应该在过马路前停下来。

“我不明白”

当我向朋友们介绍Wave时,我惊讶地发现他们脸上都是困惑的表情。“等等,这车是在说要停车,还是在告诉行人停车?”

我意识到我的设计中存在一个致命的缺陷:对于司机和行人的不同语言来说,它并不是中立的。当汽车看到红色八角形时会屈服,而行人只有看到红色的手才会停下来。更令人困惑的是,当汽车看到一个绿色的圆圈时,汽车走了,当他们看到一个白色的拐杖身影时,行人会越过。

很明显,需要明确区分发出汽车意图信号的投影和要求行人做什么。

并且,为了统一世界各地的颜色和图标的含义之间的差异,我无法停止在名词项目。我需要在网上搜索各国交通图标之间的共性,以创建所有人都能理解的彩色图标。

下一步

经过研究,我发现AV要与行人进行通信,汽车需要在移动时投射出行人熟悉的图标。在人行横道情景中,汽车投射一个绿色步行图标告诉行人可以穿越。在穿越之后,汽车可以投射出一只红色的手,向其他人发出信号,表明现在轮到他了。

Wave的另一个优点是,不同于现在的第二两个司机,今天开车时会挥手或举手,这些图标可以投影五倍长。这不仅增加了能见度,还最大限度地提高了自动驾驶汽车的安全性。

转弯

美国是有史以来最奇怪的交通惯例之一的发源地:四向停车。如果你考虑一下,四向停车是一个不同运动部件的交响乐。汽车和行人,汽车和汽车之间的政治,对于观察和采取行动的AV来说是很重要的。 Melissa Cefkin非常好地解释了这一点。

https://youtu.be/5hLEiBGPrNI

还记得文章前面关于Zoox计划的引用吗? Cefkin实际上拥有该专利。

汽车和行人最大的痛点是他们不知道对手的下一步行动是什么。行人会想“我有足够的时间跑过街道吗?司机会想“是我先到达十字路口还是他们先到达十字路口?”

Wave也能解决这个问题。有了激光雷达,也就是任何自动驾驶汽车的眼睛(或者是最上面的细长物体),AV就能提前知道2-3个足球场他之外的路线。汽车可以轻松利用四个站点的优势。

Wave进入一个十字路口,目的是左转,在他们执行转弯之前,将他们计划好的路径投射到前方几英尺处。

这使得行人和其他司机都可以看到自驾车的意图和计划要去的地方,让他们有更多的知识可以采取行动。他们不会停在汽车前面的行人,而是可以从汽车的投射路径上停下一英尺,知道它的转弯半径是因为Wave。

Wave从根本上减少了意外的冲突,简化了交叉路口,让自动驾驶车辆更加安全,甚至在这种问题出现之前,它就能改变行人和汽车之间的互动方式。

Waymo的Firefly与Wave技术叠加

现在怎么办?

Wave只能在我的电脑上走得那么远。该过程的下一步显然是在现实世界中测试它。可悲的是,这就是我的专业知识停滞不前的地方。我不仅没有一辆自动驾驶汽车可以玩,甚至没有一辆虚拟汽车可以进行实验。

我的电脑的局限性不仅仅局限于测试,它们还阻碍了我从圈子以外的人那里获得反馈。这就是我在媒体上的原因,希望研究人员能帮我把Wave带到下一个层次(眨眼,眨眼)。

自动驾驶汽车的竞赛正处于历史最高点。像Waymo这样的公司已经开始在没有司机的情况想用真人测试程序。优步( Uber )等公司因行业压力而产生了退缩。然而,也有像Zoox这样的公司可以从天而降来取代堕落者的位置。

如果你有资源帮助测试Wave,我很乐意谈谈。如果你有现金赞助这项专利,请立即给我发邮件。

目前,我将坚持在自动驾驶领域进行更多的案例研究。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180822B1UJSI00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券