同样是认猫,这家小公司居然比Google强?对,只用几张图片

来源:Bloomberg
量子位 李林 | 整理编译

认猫,是人工智能技术发展的第一推动力。

2012年,吴恩达和Jeff Dean带领的Google Brain研究小组用16000个处理器,建造了一个由10亿多个连接点构成的神经网络。随后,他们用1000万张从YouTube视频中截取的图片对这个神经网络进行训练,让它认出了猫。

昨天,创业公司Gamalon也以认猫为例展示了他们的AI,不过,这个AI不需要大量训练数据,只需要几张图片做例子。

说到这里,你大概能够猜到,他们用的一定不是深度学习。

这家公司所用的技术称为贝叶斯程序合成(Bayesian Program Synthesis),能够自动生成出只需少量数据就可以进行学习的算法。贝叶斯概率提供了一种数学框架,能够根据经验来提炼对现实世界的预测。

在认猫这件事上,我们先给Gamalon的AI提供几个例子,让它对猫的胡须、尾巴、眼睛等部分建立印象,然后这个系统每见到一张新的猫,都可以继续升级自己对于猫的认识;如果用深度学习算法,你就需要提供尽可能多的、不同类型的猫咪照片来训练它。深度学习无法处理数据太少所带来的不确定性。

将Gamalon的这种从少量数据来学习的技术应用到其他任务上,能够带来巨大的影响:借助它,机器人可以迅速探索并理解新的环境,计算机不用联网就能了解你的喜好。

Gamalon创始人、CEO Ben Vigoda

Gamalon创始人Ben Vigoda说,他们的软件能在笔记本电脑上运行,比现在流行的深度学习算法节能100倍。深度学习算法需要上千台计算机、上百万张图片来训练的任务,他们只需要几台电脑和少量图片就能完成。

这家公司创建于2013年,得到了硅谷VC们450万美元的投资,背后还有美国国防部研发机构DARPA的支持。过去几年时间里,他们一直在对概率模型进行优化,拓展它的使用范围。

十几年来,学术界一直在对基于概率的人工智能进行探索,例如2015年,MIT、纽约大学、多伦多大学的科研人员组成了一个团队,用概率方法教计算机来识别字符和物体,只需要一个例子就够了。这个团队中的Ruslan Salakhutdinov后来成了苹果的机器学习主管。

(论文传送门: http://cims.nyu.edu/~brenden/LakeEtAl2015Science.pdf )

但是,将这类算法付诸工程实践的不多。商业界使用类似技术的有微软对Xbox游戏玩家进行排序的TrueSkill、Uber去年收购的创业公司Geometric Intelligence。这类系统没有被广泛应用的一个主要原因,是它需要人类需要进行复杂、耗时的数据计算,来人工调整概率模型。

Gamalon则宣称他们的软件可以自动调整模型。

虽然Vigoda说他们的技术可以广泛应用,但Gamalon还是从一个小的领域开始切入。他们的第一个产品叫做Structure and Match,用来搜索数据库然后对数据进行统一,例如统一不同拼写的客户名称和地址。通讯硬件制造商Avaya是Gamalon少数早期客户之一,一直在使用这个软件。

Avaya有数千家分销商,他们记录客户数据的方式各不相同。为了让有效地搜索数据,Avaya需要统一数据格式,例如他们曾用来几个月的时间,雇佣人力来把数据库中街道名前面的St.改成Street。而Gamalon产品只需要几天就能完成同样的工作。

“用Gamalon, 匹配85%的数据,而不是数天,“高级总监Cary Gumbert说。 与查找和替换搜索工具不同,软件可以识别上下文,所以它不会转向,例如,“St.”在“St. 路易斯“变成”街道“。”如果我们训练它,告诉它在哪里错过了什么,“Gumbert说,”它会变得更好。

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2017-02-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏达观数据

干货分享 | 人工智能如何驱动未来教育发展?

ABOUT 1月13日下午,在沪江北京研发中心、沪江智能学习实验室和CCtalk在京举办的“智能引擎,驱动教育”技术沙龙中,达观数据创始人&CEO陈运文作为受邀...

3829
来自专栏机器学习之旅

写给想转行机器学习深度学习的同学

update 1:很多同学还是私信我,让我推荐或者提供一些电子书给他们,我这边也打包了一些我认为比较重要的,如果有需要的同学可以「邮箱」联系我。申明,我所发送的...

3154
来自专栏腾讯技术工程官方号的专栏

腾讯AI Lab:深度解读AI辅助翻译的研究及应用

11月13日,深圳 - 腾讯AI Lab今日发布了一款AI辅助翻译产品 - “腾讯辅助翻译”(Transmart),可满足用户快速翻译的需求,用AI辅助人工翻译...

17.9K3
来自专栏大数据文摘

李飞飞:我们怎么教计算机理解图片

24613
来自专栏华章科技

机器学习进阶路上的五个境界

关于机器学习,这个话题最近实在太火了,甚至有些虚火了。有了虚火,就容易有泡沫。大浪淘沙,要想在数据科学这个行业生存下来,任何一个从业者都需要认清自己的位置,每上...

1073
来自专栏机器之心

学界 | CMU通过机器学习「读心术」解码大脑复杂思想

选自CMU 机器之心编译 参与:黄小天、Smith 近日,卡内基梅隆大学官网上发表了一篇题为《Beyond Bananas: CMU Scientists Ha...

3849
来自专栏CDA数据分析师

【零一】#操作教程贴#从0开始,教你如何做数据分析#初阶#第五篇

大家好,我是零一,今天开始继续给大家带来数据分析基础系列教程。我的公众微信号是:start_data,欢迎大家收听。 上一篇中,我们提到波士顿矩阵,波士顿矩阵又...

1919
来自专栏大数据文摘

有史以来最大的数学证明:数据多达200TB

2129
来自专栏ATYUN订阅号

MIT突破:自我监督系统DON,机器人可在检查随机物体后理解它们并拾取

几十年来,装配线等受控环境中的机器人能够一次又一次地拾取同一物体。最近,计算机视觉的突破使机器人能够在物体之间进行基本区分。尽管如此,系统并没有真正理解物体的形...

892
来自专栏牛客网

数据挖掘算法工程师面经

走到现在,校招已经过了一半,自己心仪的公司也基本都走完了校招流程,我的校招随之已经结束了,在家中陪着父母过一个长假。闲下来,想远离代码,远离算法,好好的放松下自...

57510

扫码关注云+社区

领取腾讯云代金券