专栏首页人工智能快报谷歌科研人员提出单样本机器学习技术

谷歌科研人员提出单样本机器学习技术

在看到某个物体一到两次之后,我们大多数人都能认出来。但支持计算机视觉和语音识别功能的算法却需要接触数千个例子,才能对新的图像或词语变得熟悉。

现在,谷歌DeepMind的研究人员提出了一个解决方法。他们对一个深度学习算法进行了巧妙的改动,使之在接触单个例子之后即能够识别图片中的物体或其他事物——他们将之称为“单样本学习”。该团队在一个大型标签图像数据库中展示了这一功能,还在手写和语言识别中进行了演示。

谷歌DeepMind的研究人员Oriol Vinyals在一个深度学习系统上添加了记忆体组件。该团队在名为ImageNet的标签照片数据库中展示了系统的功能。软件仍然需要分析数百个类型的图片,但在此之后,软件就能在看到一张图片之后识别新的对象——例如一只狗。它可以高效学习识别图片中的特征之处。这种算法仅需看到一个例子,其识别准确率即可与传统的、需要大量数据的系统媲美。

Vinyals表示,如果这种算法可以迅速认识新词语的含义,可能就会大有用处。他认为,这可能对谷歌具有重要意义,因为它可以让系统迅速了解新的搜索词的含义。其他公司也开发了单样本学习系统,但一般与深度学习系统不兼容。2015年的一个学术项目就使用了概率规划技术支持高效的单样本学习。但深度学习系统正在变得越来越强大,在添加记忆体机制后更是如此。谷歌DeepMind的另一个小组最近使用一种灵活的记忆体开发了一个网络,使之可以执行简单的推理任务——例如,在分析若干简单的网络图之后,学会如何导航地铁系统。

韩国大田市韩国高等科技学院的大脑和机器智能实验室负责人Sang Wan Lee表示:“我认为这是一种非常有趣的办法,为在大规模数据集上进行单样本学习开辟了新颖途径。这是对人工智能界的重大技术贡献,计算机视觉研究人员可能会非常重视。”

其他人则对这种方法的实用性表示了怀疑,因为它仍然与人类学习有很大的差距。哈佛大脑科学系副教授Sam Gershman表示,人类一般是通过了解构成图像的元素来学习,而这就需要一些现实知识或者说常识,例如,“两轮平衡车可能看起来和自行车或摩托车有很大区别,但却可能是由相同的部件组成的。”

Gershman和Wan Lee都表示,在机器能达到人类的学习能力之前,还有很长的时间。Wan Lee表示:“我们还远远不足以揭示人类进行单样本学习的奥秘,但这种方案显然值得我们进一步研究。”

本文分享自微信公众号 - 人工智能快报(AI_News),作者:人工智能快报

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2016-12-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 全球人工智能行业分析

    2015年9月,美国Venture Scanner公司发表了针对全球人工智能行业的分析报告,涉及很多新兴市场。该分析报告针对人工智能(AI)行业,追踪了13个人...

    人工智能快报
  • 微软发布情绪识别API

    2015年11月11日,微软宣布其Oxford项目将开放一个可用于情绪识别的API。微软一位负责技术与研究的人员表示该API可帮助市场营销人员评估顾客对商店展示...

    人工智能快报
  • 科学家提出人机交互新方法

    2016年7月12日,美国马萨诸塞大学安姆斯特分校网站发布消息称,该校研究人员创造了一种人机控制转移的新方法。 马萨诸塞大学安姆斯特分校计算机科学研究生Kyle...

    人工智能快报
  • 学界 | ACL论文精彩论文演讲:simGAN+domain tag训练出表现优异的半监督问答模型(图文全文)

    AI 科技评论按:虽然ACL 2017已经落下帷幕,但对精彩论文的解读还在继续。下面是 AI 科技评论在ACL现场记录的Zhilin Yang的报告。Zhili...

    AI科技评论
  • DeepMind巨额亏损的背后,今天的AI是否选对了方向?

    DeepMind 可能是全世界最大的专注于科研的 AI 公司,但它正在遭受巨额亏损,过去三年的亏损超过 10 亿美元,而且未来 12 个月还有超过 10 亿美元...

    机器之心
  • Windows Phone 7实战 第一天 设计启动页面和应用程序图标

    每一个 Windows Phone 7 应用程序在启动时多少会花上一些时间,在这个等待的时刻经常都会摆放一些启动画面 (Splash screen) 先来充充场...

    张善友
  • 【答疑释惑】能看懂书,为啥写不出程序?

    疑惑一 二三线城市学习什么编程语言比较好就业? 小编最近和二三线城市的码农交流的比较多,了解到一个信息发现用java开发web的大有人在,说明一个问题真正大的有...

    程序员互动联盟
  • 永久免费的百度语音转字幕的工具

    本文档是百度AI开放平台Linux SDK (C++)BDSpeechSDK 3.x 的用户指南。描述了在线语音识别相关接口的使用说明

    thinktothings
  • 跨平台 C++ 纯socket 访问webapi json

    xiny120
  • 一篇文章看懂分布式一致性算法

    分布式服务顾名思义服务是分散部署在不同的机器上的,一个服务可能负责几个功能,是一种面向SOA架构的,服务之间也是通过rpc来交互或者是http service来...

    lyb-geek

扫码关注云+社区

领取腾讯云代金券