动态 | 谷歌开放 Quick, Draw! 数据集,8 亿世界各国人民的涂鸦都在这里

昨日,谷歌开放了其语音命令数据集,开发者可借助它搭建最基础的语音交互应用。

今天,好消息又来了:谷歌再次宣布开放一个全新的绘图数据集,它的来头可不一般:

还记得谷歌去年底发布的 AI 涂鸦游戏 Quick, Draw! 吗?

这个游戏会弹出对话框,让玩家在 20 秒内草绘一样物体,然后利用其机器学法算法对该物体进行识别,对玩家画得到底是什么给出猜测。感兴趣的小伙伴可点击这里体验。

Quick, Draw! 的本意,是谷歌的教育体验项目,帮助公众认识神经网络——比如它能做什么。设计它的谷歌工程师团队希望让大家意识到,人与机器学习系统交互也可以充满趣味性。而显然,设计者的目的已经完美达成。

自 Quick, Draw! 上线伊始,便吸引了世界各地的人们上手尝试。过去的六个月里,各国玩家在 Quick, Draw! 上进行的涂鸦,逐渐形成了一个相当庞大的数据集:

根据AI 科技评论获得的数字,来自 100 个国家的 2000 万用户,在 Quick, Draw! 上共绘制了 8 亿幅涂鸦。

今天,谷歌宣布把该数据集开放出来,供全世界的数据科学家、设计师进行分析,或许能够从人们最直觉性的涂鸦中获得产品设计思路。

目前,该数据集共包含 5000 万张涂鸦。谷歌表示,剩下的 7 亿多张会陆续发布。

谷歌表示:

“这不但是海量的数据,还是一面有意思的镜子——能借此透视怎么以众包的形式让公众参与训练机器学习系统,以及如何创建一个能反映不同文化背景与观念的数据集。”

的确,谷歌根据用户的国籍进行分组,在 Quick, Draw! 数据集中发现了不少有趣的现象。比如,不同国家人脑中的“椅子”:

韩国和俄罗斯用户脑中,最直觉性的椅子图像是侧放的,而美国、德国、巴西、南非都是正面放置的。

谷歌表示,Quick, Draw! 为研究如何避免人工智能系统对文化、种族、社会群体产生 bias(倾向),提供了非常好的研究素材。对这个话题感兴趣的读者可访问谷歌博客。

Quick, Draw! 数据集的 GitHub 地址:

https://github.com/googlecreativelab/quickdraw-dataset

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-08-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

数据新闻精选| R语言和网络图:数据叙事好帮手

R语言能挖掘、整理数据,网络图可以呈现故事脉络,两者各显神通。深度君精选数据网站FiveThirtyEight的R语言应用心得,数据新闻网络图叙事的类型,还可参...

3279
来自专栏CDA数据分析师

数据图处处有陷阱?五个案例教你轻松辨真伪

文 | Keith Collins 翻译 | 周炜乐 ? 数据图也有陷阱?即使数据准确、完整,其展现方式如果不易于读者理解,或是产生误导,也就丧失了它配合故事叙...

18610
来自专栏PPV课数据科学社区

千万别踏进这些陷阱!解密数据的8个把戏

上大学时,我和另一个姑娘(某理科大神)经常搭伙做饭。有天我俩一起去超市买油,站在琳琅满目的货架前,我直接拎起一瓶,冲她叫:“就拿这瓶吧,最便宜!”姑娘白了我一眼...

2506
来自专栏腾讯音视频实验室

腾讯音视频实验室杰出科学家刘杉:我们处于视频编解码标准制定的起点,而非终点。

2017年12月28日,由腾讯社交网络事业群(SNG)主办TSAIC学术&工业交流盛会在腾讯滨海大厦举行,150余位来自麻省理工、斯坦福、卡耐基梅隆、清华、中科...

2959
来自专栏大数据文摘

SODA大赛最高奖:基于动态网络与社会激励的新能源汽车租赁系统(视频+PPT)

1869
来自专栏量子位

黑科技 | 这个人工智能项目,正在把蜻蜓变成无人机

编译 | 量子位 若朴 Draper正在开发一个带有集能源,指导和导航系统于一身的昆虫控制“背包”,这里展示的就是一个被植入控制背包的蜻蜓。 不管我们有多努力...

1806
来自专栏PaddlePaddle

AI不思议|除了猜用户手绘图案,还能猜什么?

小伙伴们可能好奇,为什么AI猜拳能够做到如此神奇?不仅出拳速度快,还能够每次都赢?

983
来自专栏机器人网

春晚爆红的智能机器人阿尔法大起底

要问哪个节目吐槽的人最多,恐怕要数央视春晚了,看的人也一年少过一年。今年的春晚,你看了吗?如果没有看,你可能错过了一场精彩绝伦的表演,表演者不是艺术家,而是54...

2296
来自专栏大数据文摘

快讯 | Reddit关闭Deepfakes论坛,遏制“非自愿换脸情色”

1584
来自专栏全栈数据化营销

数据分析:深度解读一篇3天卖113万产品的文章

什么叫走心文案?如何写走心文案? 这个问题自从我进入职场时就一直在思考,我个人认为文案是战略或者策略的执行和体现,和渠道、营销推广是并驾齐驱的重要的,于是本文就...

2474

扫描关注云+社区