新算法应使家用机器人更好地识别对象

麻省理工学院的新研究表明,使用现成的算法来聚合不同的观点的系统允许家用机器人识别四倍的对象作为使用单个视角的对象,同时减少错误识别的次数。

对于家庭机器人来说,他们需要能够识别他们应该操纵的物体。但是,虽然对象识别是人工智能最广泛研究的主题之一,但即使最好的物体探测器也仍然失败了很多时间。

MIT计算机科学和人工智能实验室的研究人员认为,家用机器人应该利用他们的移动性和相对静态的环境,以使对象识别在进行多个视角之前,在判断他们的身份之前通过多种视角来实现。然而,匹配不同图像中描绘的对象,因此构成了自己的计算挑战。

在出现在即将出现的国际机器人研究期刊上的纸质中,MIT研究人员表明,使用现成的算法汇总不同的角度的系统可以识别四倍的物体,作为使用单个视角的物体,虽然减少了错误识别的次数。

然后,它们呈现了一种像新的算法一样准确,但在某些情况下,在某些情况下是快速的10倍,使家庭机器人的实时部署更加实用。

“如果您从一个角度拍摄了看它的输出,那么可能缺少了很多可能缺失的东西,或者它可能是照明角度或阻挡探测器中系统错误的物体的角度,”劳森说黄金,电气工程与计算机科学研究生和新论文的主要作者。“围绕这的方式只是为了四处走动并转到不同的观点。”

第一个刺

Wong和他的论文顾问 - 计算机科学与工程的松下高兴教授,以及卓越教学教授工程教授的TomásLozano-Pérez,被认为是他们拥有20到30个不同的家庭物体图像集聚集在一起的场景一张桌子。在几个方案中,群集包括多个同一个对象的实例,紧密包装在一起,这使得任务匹配不同的观点更加困难。

他们尝试的第一个算法是为跟踪系统(如雷达)开发,也必须确定在不同时间上成像的物体是否实际上是相同的。“已经存在了几十年,”王说。“并且有一个充分的理由,这是它真的很好。这是大多数人想到的第一件事。“

对于每对连续图像,该算法生成多个假设关于哪个对象对应于另一个对象。问题是添加了作为新视角的假设化合物的数量。为了保持计算可管理,算法在每个步骤中丢弃其顶端假设的所有内容。即便如此,在生成最后一个假设之后,通过它们进行排序,是一个耗时的任务。

代表性抽样

希望获得更有效的算法,MIT研究人员采用了不同的方法。它们的算法不会丢弃其在连续图像上生成的任何假设,但它也不会尝试全部配置它们。相反,它随机从它们上采样。由于不同假设之间存在显着重叠,因此充分数量的样本通常会在任何两个连续图像中对象之间的对应关系产生共识。

为了使所需数量的样本低,研究人员采用了一种用于评估假设的简化技术。假设算法从一个透视图中识别了三个对象,四个从另一个透视中识别了三个对象。比较假设的最重要的方法是考虑两组对象之间的所有可能匹配的匹配项:将对象1,2和3匹配的集合与第二个视图中的对象1,2和3匹配;将对象1,2和3匹配的集合在第一到对象1,2和4中的第1,2和4中的4;将对象1,2和3匹配的集合在第二个视图中与对象1,3和4匹配,等等。在这种情况下,如果您包括检测器已经出错的可能性,并且某些对象从某些视图中封闭,那么该方法将产生304种不同的匹配集。

相反,研究人员的算法分别考虑了第一组中的每个对象,并评估其映射到第二组的对象的可能性。因此,第一组中的对象1可以在第二个,如可以对象2,等等。同样,随着误差和遮挡的可能性,这种方法只需要20个比较。

然而,它确实将门打开到荒谬的结果。该算法可以得出结论,第二组中的对象3的最可能匹配是第一组中的对象3 - 并且还可以得出结论,第二组中的对象4最可能匹配是第一组中的对象3。因此,研究人员的算法也寻找这种双重映射并重新评估它们。这需要额外的时间,但几乎没有考虑聚合映射的那么多。在这种情况下,该算法将执行32个比较 - 超过20,但显着小于304。

出版物:在国际机器人研究杂志中发表

图像:Christine Daniloff和Jose-Luis Olivares / MIT

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。