专栏首页量子位DeepMind大放送:开放4个多物体表征学习数据集,还有一篇智能体新研究

DeepMind大放送:开放4个多物体表征学习数据集,还有一篇智能体新研究

铜灵 发自 凹非寺 量子位 出品 | 公众号 QbitAI

“专注开源一百年”的DeepMind,今天又有了新动作。

这次连环放送包含的新物件不少:四个多物体表征学习数据集,还有一个能在强化学习中有效利用演示解决难题的智能体新研究。

具体来看。

多物体表征学习数据集们

这是4个多物体表征学习数据集,可用于开发场景的分解方法,如MONet模型和IODINE。

MONet(简称“莫奈”)是DeepMind今年3月发布的神经网络,它把每个物体,圆满地从背景里分离出来。这样的技能,完全是在无监督的学习过程中解锁的。

就像下面这样:

IODINE (简称“碘”) 是与莫奈一同发布的,也是无监督网络,也可以让画面里的每一个角色随意奔跑。

而新发布的这四个数据集,就可以与莫奈与碘配合使用。

研究人员表示,这个数据集由多个物体场景组成,每张图像都包含场景中所有物体的ground-truth分割蒙版。

研究人员还为每个物体提供了生成因子(generative factors)促进表征学习。生成因子包含了描述和渲染场景中出现物体的所有必要和充分特征(Feature),包括大小、颜色和位置等。

此外,segmentation_metrics模块中包含调整后Rand index的TensorFlow实现,可用于比较推断物体分割和ground-truth分割蒙版。

这些代码已经经过内部测试,与TensorFlow r1.14配合服用效果更佳。

数据集四胞胎的大娃叫Multi-dSprites,大小500MB到1GB之间,是一个基于精灵图的数据集。

在计算机图形学中,当一张二维图像集成进场景中,成为整个显示图像的一部分时,这张图就称为精灵图。所以在这个数据集中,多个物体是椭圆形、心形或者方形的图片。

这个数据集由三个版本,每个版本有1M数据点。每个数据点包含图像、背景和物体蒙版,以及ground-truth特征。

二娃是Objects Room,这个数据集基于生成查询网络(Generative Query Network)的MuJoCo 环境,是3D形状数据集的多物体扩充。

每个场景中包含2种元素:1间由天花板、墙壁和地板组成的空房,最多六个物体,并且颜色随机、样式随机。训练集大小为7GB,测试集在6-8MB之间。

三娃是CLEVR (with masks),这是基于此前的Clever数据集改造的,可以生成ground-truth分割蒙版。

数据集中的图像和蒙版规模为320×240大小,整个数据集大小为10.5GB。

四娃是Tetrominoes,这是一个类似俄罗斯方块里形状的数据集,大小为300MB。

每个形状都由四个方块组成,总共有17种排列。颜色有6种选择,分别为红绿蓝黄品红青。

研究人员用x和y坐标进行定位,用shape和color(整数编码)代码块为ground-truth特征。数据点还包括一个visibility向量。

还有新论文

DeepMind开源动作频频,除了这些数据集,这两天还公布了一项新的智能体研究。

在论文Making Efficient Use of Demonstrations to Solve Hard Exploration Problems中,研究人员提出一种能够利用演示解决部分可观测环境中硬探测问题的智能体:R2D3。

研究人员R2D3利用演示解决高度可变的初始环境中的稀疏奖励任务,并用8项任务进行测试展示了智能体的有效性。

值得一看~

传送门

数据集GitHub地址: https://github.com/deepmind/multi_object_datasets

论文地址: https://arxiv.org/abs/1909.01387

今天的DeepMind大放送就到这了~

本文分享自微信公众号 - 量子位(QbitAI),作者:关注前沿科技

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-09-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 搞AI的产品经理该怎么写PRD?谷歌的导师教你

    最近,谷歌机器学习X 和TensorFlow X团队的产品领导者Clemens Mewald在Medium上发表了一篇文章,详细介绍在开发涉及到机器学习的产品时...

    量子位
  • AI医疗来袭,患者、机构、数据科学家分别有哪些新机会?

    原作:Jeremy Howard 安妮 编译自 Hacker Noon 量子位 出品 | 公众号 QbitAI 本文作者Jeremy Howard,澳大利亚数据...

    量子位
  • 数据集查找神器!100个大型机器学习数据集都汇总在这了 | 资源

    网上各种数据集鱼龙混杂,质量也参差不齐,简直让人挑花了眼。想要获取大型数据集,还要挨个跑到各数据集的网站,两个字:麻烦。

    量子位
  • 经典项目应用场景分享-上

    版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.n...

    用户1149268
  • 2017中国地方政府数据开放平台报告在京发布

    2017年12月15日,由新华网主办的2017中国大数据产业年会在北京成功举行。该年会以“大数据助力中国新经济”为主题,汇聚大数据“产学研”大咖,共同探讨大数据...

    企鹅号小编
  • “大数据”时代,什么是数据分析做不了的?

    不久之前我曾与一位大型银行的首席执行官一同用餐。他正在考虑是否要退出意大利市场,因为经济形势不景气,而且未来很可能出现一场欧元危机。 这位CEO手下的经济学家描...

    CDA数据分析师
  • 每个数据科学家都应该学习4个必备技能

    IT派 - {技术青年圈} 持续关注互联网、大数据、人工智能领域 摘要: 作为一个数据科学家你必须要掌握的四个必备技能,值得每个想要成为数据科学家和已经成为...

    IT派
  • 数据太多、太乱、太杂?你需要这样一套数据治理流程

    最近,明略科技与合肥工业大学的研究者在中文核心期刊《软件学报》上发表了一篇关于数据治理的论文。它介绍了数据治理的概念,并对数据清洗、交换和集成等进行具体分析,从...

    机器之心
  • 【计算机基本概念】如何理解内存?

    内存是计算机中重要的部件之一,它是与CPU进行沟通的桥梁。计算机中所有程序的运行都是在内存中进行的,因此内存的性能对计算机的影响非常大。内存(Memory)也被...

    程序员互动联盟
  • Facebook数据盗用风波不止,Expedia旗下又传88万张信用卡信息泄露

    最近Facebook近5000万用户数据涉嫌被盗用的风波刚刚过去,又有外媒消息称,Expedia旗下旅游预订网站Orbitz可能有约88万个信用卡用户的信息遭到...

    安恒信息

扫码关注云+社区

领取腾讯云代金券