专栏首页AI研习社谷歌开放 Quick, Draw! 数据集,8 亿世界各国人民的涂鸦都在这里

谷歌开放 Quick, Draw! 数据集,8 亿世界各国人民的涂鸦都在这里

昨日,谷歌开放了其语音命令数据集,开发者可借助它搭建最基础的语音交互应用。

今天,好消息又来了:谷歌再次宣布开放一个全新的绘图数据集,它的来头可不一般:

还记得谷歌去年底发布的 AI 涂鸦游戏 Quick, Draw! 吗?

这个游戏会弹出对话框,让玩家在 20 秒内草绘一样物体,然后利用其机器学法算法对该物体进行识别,对玩家画得到底是什么给出猜测。感兴趣的小伙伴可点击这里体验。

Quick, Draw! 的本意,是谷歌的教育体验项目,帮助公众认识神经网络——比如它能做什么。设计它的谷歌工程师团队希望让大家意识到,人与机器学习系统交互也可以充满趣味性。而显然,设计者的目的已经完美达成。

自 Quick, Draw! 上线伊始,便吸引了世界各地的人们上手尝试。过去的六个月里,各国玩家在 Quick, Draw! 上进行的涂鸦,逐渐形成了一个相当庞大的数据集:

根据AI研习社获得的数字,来自 100 个国家的 2000 万用户,在 Quick, Draw! 上共绘制了 8 亿幅涂鸦。

今天,谷歌宣布把该数据集开放出来,供全世界的数据科学家、设计师进行分析,或许能够从人们最直觉性的涂鸦中获得产品设计思路。

目前,该数据集共包含 5000 万张涂鸦。谷歌表示,剩下的 7 亿多张会陆续发布。

谷歌表示:

“这不但是海量的数据,还是一面有意思的镜子——能借此透视怎么以众包的形式让公众参与训练机器学习系统,以及如何创建一个能反映不同文化背景与观念的数据集。”

的确,谷歌根据用户的国籍进行分组,在 Quick, Draw! 数据集中发现了不少有趣的现象。比如,不同国家人脑中的 “椅子”:

韩国和俄罗斯用户脑中,最直觉性的椅子图像是侧放的,而美国、德国、巴西、南非都是正面放置的。

谷歌表示,Quick, Draw! 为研究如何避免人工智能系统对文化、种族、社会群体产生 bias(倾向),提供了非常好的研究素材。对这个话题感兴趣的读者可访问谷歌博客。

Quick, Draw! 数据集的 GitHub 地址:

https://github.com/googlecreativelab/quickdraw-dataset

本文分享自微信公众号 - AI研习社(okweiwu),作者:三川

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-09-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • AMiner发布计算机领域知识图谱,包括20多万条专家信息、50多万篇出版论文

    日前,清华大学副教授、Arnetminer创始人唐杰在微博公开表示AMiner将发布计算机领域的专业知识图谱Science Knowledge Graph (S...

    AI研习社
  • CIKM 2019 挑战杯冠军方案分享:「初筛-精排」两阶求解框架

    CIKM 是中国计算机学会(CCF)推荐的数据库/数据挖掘/内容检索领域的 B 类会议。CIKM AnalytiCup 挑战赛是会议同期举行的国际数据挖掘比赛,...

    AI研习社
  • 博客 | 你需要新的好奇心方法克服强化学习中的「拓展症」

    雷锋网 AI 科技评论按:强化学习(RL)是当下机器学习最活跃的研究方向之一,其中智能体在做正确的事情时获得奖励,否则获得惩罚。这种「胡萝卜加大棒」的方法简单、...

    AI研习社
  • 动态 | 谷歌开放 Quick, Draw! 数据集,8 亿世界各国人民的涂鸦都在这里

    昨日,谷歌开放了其语音命令数据集,开发者可借助它搭建最基础的语音交互应用。 今天,好消息又来了:谷歌再次宣布开放一个全新的绘图数据集,它的来头可不一般: 还记得...

    AI科技评论
  • 业界 | 向机器学习偏见开战:谷歌展示全球涂鸦数据集分析结果

    选自Google Research 作者:Reena Jana等 机器之心编译 参与:路雪 机器学习系统对日常生活的影响越来越大,软硬件产品都使用机器学习系统为...

    机器之心
  • 成为一个优秀的工程师你需要做到这些

    一位工程师,如何才能称得上优秀?除了写得一手好 Code,什么样的工作态度和方法才是一个优秀工程师的必备?

    慕容千语
  • 案例分析:利用OAuth实施钓鱼

    OAuth百科 OAUTH(Open Authorization)协议为用户资源的授权提供了一个安全的、开放而又简易的标准。同时,任何第三方都可以使用OAUTH...

    FB客服
  • 谷歌开发AI新工具:预测病人死亡时间 将应用到诊所

    谷歌旗下的Medical Brian团队开发了一种新的人工智能算法,可以帮助医院预测病人的死亡时间,并有望在医疗领域展开更广泛的应用。

    周俊辉
  • 服务器使用秘钥进行登录并禁止root用户使用密码登录

    id_rsa.pub 是私钥 id_rsa 是公钥 authorized_keys 是sshd服务配置的文件名所以将私钥内容输出进来

    用户2475223
  • 生信人写程序1. Perl语言模板及配置

    生物信息领域常用语言 个人认为:是否能熟悉使用Shell(项目流程搭建)+R(数据统计与可视化)+Perl/Python/Java..(胶水语言,数据格式转换...

    生信宝典

扫码关注云+社区

领取腾讯云代金券