MIT分布式运算革新机器学习算法

从语音识别系统到自助停车等人工智能领域,“机器学习”的最新进展总能吸引大众的眼球。

所谓机器学习,就是让计算机在数据库中搜索特定模型从而获得新技能,以及让自主机器人对所处环境建立行为模型。但是,这种建模在集群机器人协同工作中变得非常复杂。这些机器人可能集体搜集到很完美的、但对单个机器人毫无用处的模型。

如果机器人由于动力、通信和运算的限制不能将所有数据整合到一起,它们怎么能完成共同建模?

据物理学家组织网近日报道,即将在7月份举行的“人工智能的不确定性”研讨会上,来自麻省理工学院信息与决策系统实验室的研究人员,会解答上述问题。他们将展示一组运算方法,证明让两个间谍机器人共同搜索一栋建筑物,在它们经过大厅时,会彼此交换分析结果。

先分再合不“卡壳”

在这个实验中,研究人员运用了分布式运算方案,这一方案优于目前流行的将数据聚合在单个位置的标准算法。

“单个计算机需要从巨型批处理数据库学习建模以处理难题,但在糟糕的处理方案出现时,它们通常会卡壳。如果小数据块被单个计算机预先处理再整合,最后建立的模型则很少出现卡壳现象。”麻省理工学院航空航天专业毕业生特雷沃·坎贝尔在与导师乔纳森·豪尔·理查德·科克马克劳林教授共同写的一篇论文中总结道。坎贝尔的新算法是非常灵活的分散网络学习程序。

想象一下,多个机器人在不熟悉的办公空间中展开搜索,你会对坎贝尔和豪尔解决的问题有点感觉。如果这些机器人的学习程序在平均水平,它们不需要预先知道什么是椅子、什么是桌子或什么是一间会议室或办公室。但是它们可以判断出,有些房间包含一些小型椅子形状的物品和大概同样多桌子形状的物品,而另一个房间包含大量椅子形状的物品和一张桌子形状的物品。

随着时间的推移,每个机器人会根据自己搜索的房间和屋内物品建立自己的清单。但是也存在误差:比如一个机器人碰巧进到一间会议室,会议室里有一些参观人员留下的手提箱,从而总结出“手提箱”也是会议室的常规特征;另一个机器人可能进入厨房,而咖啡机被打开的冰箱门遮挡住,从而将咖啡壶从厨房用品的清单中删除。

理想情况下,当两个机器人相遇,它们会自动比较双方的产品清单,加强对彼此的观察,防止遗漏或以偏概全。问题是,它们不知道如何与“厨房”或“会议室”的类别标签进行匹配,它们只能判断出是“房间1”和“房间3”,但这个机器人的“房间1”很可能就是另一个机器人的“房间3”。

用坎贝尔和豪尔的算法,这些机器人会尝试在共享物品清单的基础上相互匹配类别,并尽全力合并有关联物品的清单。当任意一个机器人遇见其他机器人时,都将执行相同的程序,最关键的是,每个机器人都是先独立列出清单再去跟其他的机器人进行匹配,从而逐步构建更多和更精确的模型。

人工重建新“秩序”

研究人员在论文中呈现了上述看起来比较简单的程序,但是这个简单的程序背后,是一些相当复杂的数学分析。

“近年来,机器学习的方式是假设一个简单的模型,然后用它来接近你想要的结果,当然前提条件是你能够处理所有的细微差别和复杂性。”坎贝尔说,“我们的算法是一种人工重构,即在你成功解决简单问题后,使用该人工重构恰当地合并模型。”

在实际应用中,机器人不会被指派去区分含有不同物品的房间,而更可能会被用来区分物品本身和用途。坎贝尔和豪尔的算法可以启发“机器学习”面临的其他问题。

此外,这个根据房屋内物品辨别房间的例子,类似于自然语言处理中的主题建模,即一台计算机可以使用单词的关联频率进行主题文件分类。

传统的机器学习算法可以对所有存放在一个集中网址的所有文件采用一致的分类方案,但是坎贝尔和豪尔的算法,可以用分布式服务器将分散在网络角落里的文档集中在一个主题下进行建模。

“分布式计算在部署登陆机器人和空降机器人等多种机器人时将发挥关键作用。”杜克大学计算机工程和研究部副教务长劳伦斯·卡恩教授说,“在本文中提出的分布式运算方法既高效又实用,关键是它打破了贝叶斯推理中证明的对称性。这个问题解决方案非常新颖,并很可能被其他研究人员继续运用。”

原文发布于微信公众号 - 机器人网(robot_globalsources)

原文发表时间:2014-07-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏牛客网

热乎的腾讯数据分析实习生面经

早上九点半,五星级酒店房间里一对一面试。 面试官是个笑起来很好看的南方美女,我猜应该是搞推荐算法的。 开场是常规,自我介绍,介绍简历中的项目经历。很失败,被批用...

39070
来自专栏新智元

AI 再造搜索3招:谷歌如何用机器学习和深度学习直接给你答案

【新智元导读】搜索是最先一批被人工智能深刻改变的行业,这不仅仅是因为搜索公司(谷歌、百度、微软)跑在了AI 革命的前面。本文从搜索结果、视频搜索和精准营销/SE...

33040
来自专栏CDA数据分析师

你真的懂什么叫数据挖掘吗?

我对做事的流程非常感兴趣。我想要知道一些可以把事情做好的好方法,甚至在可能的情况下可以知道做这些事情的最好方式。就算你的技能不强,理解相关方面的知识不深,这个过...

24450
来自专栏量子位

谷歌再推AI开源平台AI·ON,你有机会参与Bengio的项目了

安妮 发自 凹非寺 量子位 出品 | 公众号 QbitAI 再次亮相。 首次推出一年后,谷歌又重新推出了AI开源项目讨论合作平台AI·ON(Artificial...

30860
来自专栏大数据文摘

Intel研究院院长吴甘沙演讲全文:大数据分析师的卓越之道(32PPT)

315110
来自专栏大数据文摘

【干货】推荐系统原理介绍

509120
来自专栏AI派

数据驱动型阿尔法模型在量化交易中的应用

数据驱动型策略一般是指通过使用机器学习算法,数据挖掘技术对选定的数据进行分析来预测未来市场的走向。相比于理论驱动型策略,数据驱动型策略相对难以理解,并且使用的数...

427100

用于入门的最佳机器学习资源

这是一个非常难写的文章,因为我希望它是真正有价值的。

298100
来自专栏ATYUN订阅号

世界上最大的大脑:拥有一百万个处理核心的神经形态计算机

科学家刚刚激活了世界上最大的“大脑”:一台拥有一百万个处理核心和1,200个互连电路板的超级计算机,它们像人脑一样运作。科学家宣布,这是世界上最大的神经形态计算...

9710
来自专栏PPV课数据科学社区

【干货】个性化推荐十大挑战(中)

前文介绍了个性化推荐十大挑战的背景其中的数据稀疏性问题,冷启动问题。本篇介绍个性化推荐十大挑战中的大数据处理与增量计算问题,多样性与精确性的两难困境,推荐系统的...

41190

扫码关注云+社区

领取腾讯云代金券