家用机器人需要更出色的识别算法

机器人网

发布于 2018-04-13 14:33:23

4400

发布于 2018-04-13 14:33:23

文章被收录于专栏：机器人网

MIT：家用机器人必须要面对一个现实，他们需要识别他们要处理的对象。尽管对象识别是人工智能领域最广泛的研究课题之一，即使是最好的对象探测器在大多数时候还是会失败。麻省理工学院（MIT）计算机与人工智能实验室的研究人员认为，家用机器人应当利用他们的机动性和相对稳定的环境，在下判断之前，通过多角度拍摄物体图片，让物体识别变得更容易。匹配不同图像中描绘的物体，提出自己的计算挑战。在即将出版的国际机器人研究杂志上的一篇文章中，MIT研究人员发现，一个系统使用现成算法，从多角度识别物体比从单角度识别物体多四倍，并且识别出错的数量会降低。然后，他们提出了一种新的算法，该算法一样准确，但是在某些情况下会快10倍，这使它更适用于实时部署家用机器人。电气工程和计算机科学的研究生、论文的第一作者Lawson Wong说，“如果你只是从一个角度看物体，可能会错失很多的东西，可能是照明的角度问题，或者是有东西挡住了物体，这可能导致探测器的系统错误。有一个解决方法是在物体的周围移动，并获得不同角度的图片。” 首次尝试 Wong 和他的论文导师——计算机科学与工程系的松下教授Leslie Kaelbling和卓越教学工程教授Tomás Lozano-Pérez——考虑的方案中，针对杂乱聚集在桌子上的物体需要20到30张图片。在很多情况下，这些物体可能包括多个相同的物体紧密堆积在一起，这就使得不同角度的匹配任务变得更困难。

他们尝试的第一个算法是为雷达等追踪系统而开发的，它必须确定不同时间成像的物体是否是同一个。Wong说，“它已经存在了几十年。有一个很好的原因，那就是它的效果确实很好。这是很多人想到的第一个事情。” 对于每对连续图像，该算法生成多个假设的对象，其中某些是对应其他物体的。问题是假设的混合物的数量会被作为新的视角被添加。为了保持计算的可控性，该算法抛弃了每一步最高假设之外的所有东西。即便如此，在最后一个假设产生之后再进行排序，也是一个非常耗时的任务。 典型抽样 为了寻找一个更有效的算法，MIT研究人员选择了一个不同的方法。他们的算法不丢弃连续图像产生的任何假设，但它也不详细检查所有的假设。取而代之的是，对他们进行随机抽样。因为不同的假设之间会显著重复，足够数量的样本，使得物体在两个连续图像上会产生一致对应关系。为了尽量降低所需样本的数量，研究人员选择了简化技术来评估假设。假设该算法从一个角度确定有三个物体，从另一个角度确定有四个。鉴别假设的最准确的数学方法是考虑两组物体之间所有可能匹配的组合：第一个角度的1、2、3和第二个角度的1、2、3是匹配的物体；第一个角度的1、2、3 和第二个角度的1、2、4是匹配的物体；第一个角度的1、2、3和第二个角度的1、3、4师匹配的物体，等等。在这种情况下，如果还包括检测器出错以及有些物体在某些角度被遮挡的可能性，这种方法会有304种不同的匹配组合。相反，MIT研究人员的算法是分别考虑第一组中的每一个物体，并评估他们在第二组中映射物体的可能性。因此，第一组中的物体1可能映射第二组中的1、2、3或4，物体2也是如此，等等。把出错和遮挡的可能性考虑在内，这种方法也进需要进行20组对比。然而，它也对荒谬的结果敞开了大门。该算法可能得出这样的结论，第二组里的物体3跟第一组里的物体3最匹配，它也可能得出另一种结论，第二组里的物体4跟第一组里的物体3最匹配。因此，研究人员的算法也需要双重映射和重新评估。这需要更多额外的时间，但也远少于考虑所有映射耗费的时间。在这种情况下，算法需要进行32次对比，大于20次，但远少于304次。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2015-01-20，如有侵权请联系 cloudcommunity@tencent.com 删除

机器人