动态 | 谷歌开放 Quick, Draw! 数据集,8 亿世界各国人民的涂鸦都在这里

昨日,谷歌开放了其语音命令数据集,开发者可借助它搭建最基础的语音交互应用。

今天,好消息又来了:谷歌再次宣布开放一个全新的绘图数据集,它的来头可不一般:

还记得谷歌去年底发布的 AI 涂鸦游戏 Quick, Draw! 吗?

这个游戏会弹出对话框,让玩家在 20 秒内草绘一样物体,然后利用其机器学法算法对该物体进行识别,对玩家画得到底是什么给出猜测。感兴趣的小伙伴可点击这里体验。

Quick, Draw! 的本意,是谷歌的教育体验项目,帮助公众认识神经网络——比如它能做什么。设计它的谷歌工程师团队希望让大家意识到,人与机器学习系统交互也可以充满趣味性。而显然,设计者的目的已经完美达成。

自 Quick, Draw! 上线伊始,便吸引了世界各地的人们上手尝试。过去的六个月里,各国玩家在 Quick, Draw! 上进行的涂鸦,逐渐形成了一个相当庞大的数据集:

根据AI 科技评论获得的数字,来自 100 个国家的 2000 万用户,在 Quick, Draw! 上共绘制了 8 亿幅涂鸦。

今天,谷歌宣布把该数据集开放出来,供全世界的数据科学家、设计师进行分析,或许能够从人们最直觉性的涂鸦中获得产品设计思路。

目前,该数据集共包含 5000 万张涂鸦。谷歌表示,剩下的 7 亿多张会陆续发布。

谷歌表示:

“这不但是海量的数据,还是一面有意思的镜子——能借此透视怎么以众包的形式让公众参与训练机器学习系统,以及如何创建一个能反映不同文化背景与观念的数据集。”

的确,谷歌根据用户的国籍进行分组,在 Quick, Draw! 数据集中发现了不少有趣的现象。比如,不同国家人脑中的“椅子”:

韩国和俄罗斯用户脑中,最直觉性的椅子图像是侧放的,而美国、德国、巴西、南非都是正面放置的。

谷歌表示,Quick, Draw! 为研究如何避免人工智能系统对文化、种族、社会群体产生 bias(倾向),提供了非常好的研究素材。对这个话题感兴趣的读者可访问谷歌博客。

Quick, Draw! 数据集的 GitHub 地址:

https://github.com/googlecreativelab/quickdraw-dataset

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-08-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏小俊博客

微软将数据中心沉入大海 省钱环保拯救地球

1042
来自专栏Crossin的编程教室

写给新手程序员的一封信

  首先,欢迎来到程序员的世界。在这个世界上,不是有很多人想创造软件并解决问题。你是一名hacker,属于那些愿意做一些有挑战性的事情的人。   “当你不创造东...

3388
来自专栏机器人网

让塑料吸管变身智能机器人

去年初,Kickstarter上出现了一个名为“Strawbees”的项目,通过一个小接头把吸管变成搭建类益智玩具。最近有人在 Strawbees 上添加了一些...

2416
来自专栏数据科学与人工智能

【应用】从业务数据分析到机器学习应用的一次经历

本文通过一次完整的项目经历,从业务数据的分析开始,到产品优化建议,再到通过机器学习进行进一步的处理进行了比较完成的提炼。 腾讯电脑管家作为一款目前最流行的pc端...

1000
来自专栏PPV课数据科学社区

【学习】利用爬虫技术能做到哪些很酷、很有趣、很有用的事情?

分析篇 先给大家看一些分析结果吧。大家几点睡觉呢? 我们来统计一下 sleep 这个词在 Twitter 上出现的频率。 看来很多人喜欢在睡前会说一声我睡了。那...

3997
来自专栏知晓程序

外卖党必备!这款小程序一键帮你 AA 算钱

不是为了几块钱抠门,对于刚工作的职场新人、学生党来说,总是这样真的是伤不起,为了面子还不好意思开口。

363
来自专栏FSociety

Python实现「碟中谍」5W条评论可视化

本篇文章会针对用户在猫眼上对于「碟中谍6」的评论进行一个可视化分析,我们总共采集了44872条用户评论,文章内容包括:

1103
来自专栏企鹅号快讯

2017年度最弱鸡密码出炉:霸主仍旧无人能及

【天极网网络频道】互联网的危险无处不在,因而为自己的账户挑选一个安全系数高的秘密是一个很重要的事情,甚至还有用户不辞劳苦地为其所有账户都设置了双因素认证。尚有不...

1925
来自专栏PPV课数据科学社区

R 家族又添新丁,5个数据科学专用包,怀着探索的心态来使用吧

李垠序编译 出处:雪晴数据网 R生态体系有其非常之美,在于它的新包贡献系统,而这也可能是R使用者显著增加的根本原因。这一特点与坚如磐石的基础包版本库(CRAN...

33810
来自专栏腾讯Bugly的专栏

《从业务数据分析到机器学习应用的一次经历》

本文通过一次完整的项目经历,从业务数据的分析开始,到产品优化建议,再到通过机器学习进行进一步的处理进行了比较完成的提炼。

55111

扫码关注云+社区