谷歌在云平台上提供包含5000万涂鸦的数据集

编译:chux

出品:ATYUN订阅号

你可以通过涂鸦的方式来表现一个人:这是由谷歌创意实验室于2016年11月推出的一项互动式网络实验Quick Draw背后的想法。它招募了网友来用画图进行描述说明,同时利用AI来尝试识别绘制的内容。

Quick Draw已经收集了超过10亿个图表,涉及345个类别,谷歌去年开源其中5000万个包含元数据,包括提示和用户地理位置。今天,谷歌将它们通过谷歌云平台(GCP)以API和附带的Polymer组件的形式提供(Polymer是一个用于构建Web应用程序的开源JavaScript库)。

从本周开始,加入公共谷歌群组的GCP客户都可以通过搜索并将其添加到项目,从而将API添加到其库中。使用Polymer组件,可以用单行代码在基于Web的应用程序中显示涂鸦。

谷歌创意实验室的创意技术专家Nick Jonas表示,“当我们发布数据集时,它基本上是345个类别中每个类别的文件,使用起来有点麻烦。过去一年中进行的大量研究都是对整个数据集的大量分析。我们从开发人员那里获得了一些反馈,他们表示他们想要一种更简单的方法快速建模数据。”

Jonas解释说,Quick Draw API(使用Google Cloud Endpoints来托管Node.js API)提供对原始数据集中包含的相同5000万个文件的访问,但不需要全部下载。它返回JSON对象或HTML画布为每个绘图进行渲染。“用户在开始使用数据之前不必下载各种数据,”Jonas说。

从数据中也获得了令人惊讶的见解。Quartz在6月份进行的一项研究发现,86%的美国涂鸦者是逆时针画圈,而80%的日本涂鸦者顺时针画圈(差异可归因于日语写作中的左上至右下笔顺序)。同时,Google Research的一项内部调查发现,来自西方国家的用户涂鸦方向基本与亚洲用户绘制的方向相反。

数据集也被创造性地使用。英国艺术家Neil Mendoza使用面部跟踪算法在人的头部应用Quick Draw草图,德国计算机科学家Deborah Schmidt使用30万个随机涂鸦的子集来填充拼贴的字母模板。

未来,团队考虑将涂鸦迁移到数据库,这将提供细粒度的访问控制。理论上,用户可以执行诸如“给我一张2017年3月来源于中国的认证图纸”这样的查询。

Jonas表示,“我只是想鼓励人们以新的方式使用数据集并做出贡献,看看可能进行怎样的扩展。”

项目:quickdraw.withgoogle.com/

代码:github.com/googlecreativelab/quickdraw-dataset

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2018-11-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏FreeBuf

定位系统那些事儿

LBS随着移动互联网的火热而在近年成为一个火热的概念,其本义是基于位置的服务(Location Based Service),而如何定位位置成为LBS中的基本。...

2935
来自专栏人工智能LeadAI

一个优雅的框架 | Pytorch 初体验

pytorch是啥呢?其实pytorch是一个python优先的深度学习框架,是一个和tensorflow,Caffe,MXnet一样,非常底层的框架,它的前身...

4299
来自专栏算法+

音频算法之小黄人变声 附完整C代码

前面提及到《大话音频变声原理 附简单示例代码》与《声音变调算法PitchShift(模拟汤姆猫) 附完整C++算法实现代码》

8157
来自专栏WOLFRAM

多范式数据科学的应用:ThrustSSC超音速汽车工程

本文译自Wolfram技术沟通与战略总监Jon McLoone于2018年9月11日的博客文章:Thrust Supersonic Car Engineerin...

1342
来自专栏灯塔大数据

学神之路 —— Python数据科学全攻略

Python菜鸟到Python Kaggler 如果你梦想成为一名数据科学家,或者已然是数据科学家的你想扩展自己的工具库,那么,你找对地方啦。本文旨在为做数据分...

3037
来自专栏大数据文摘

Kaggle | 使用Python和R绘制数据地图的十七个经典案例(附资源)

8295
来自专栏腾讯大讲堂的专栏

AI异常计算点的监控调度

1747
来自专栏AI派

还没准备好数据呢,为什么要着急用算法呢

开始之前,通知下我的读者,随着订阅读者越来越多,为了对读者们负责,有以下几件事情需要告知下:

2176
来自专栏鹅厂网事

服务器硬盘故障预测实践

故障预测类似于临震预报,最重要的意义是给用户一个从容的时间段进行数据和业务的迁移或处理,改善用户体验。

1.9K9
来自专栏腾讯架构师的专栏

AI 异常计算点的监控调度

互联网产业拥抱 AI 成为了当下的热潮,这些业务源源不断的计算力均来自腾讯架平 TCS-弹性计算平台。建设中最突出的问题是如何发现并调度异常计算点,本文从 cp...

5320

扫码关注云+社区

领取腾讯云代金券