谷歌强力推出数据集搜索!Dataset Search神器重磅来袭


新智元报道

来源:blog.google

编辑:三石

【新智元导读】继Google学术搜索之后,谷歌又一神作——Dataset Search重磅来袭!

千呼万唤始出来!Google Dataset Search腾空出世了!

还记得曾经的你,在做科研的时候,为了得到一份儿数据集,绞尽脑汁各种百度、各种google,但结果往往一无所获。从今儿起,再也不用担心这个问题了!

谷歌超级重磅神器来也:

Dataset Search——数据集搜索领跑者

数据,可以说是当今世界众多科学家与工作人员赖以生存的一片沃土。而在网络中存在成千上万个数据存储库,科研人员亦可以访问及使用这些数据集。

为了方便科学家和数据相关研究、工作人员能够轻松访问这些数据,谷歌启动了“数据集搜索(Dataset Search)”。

与谷歌Scholar工作方式类似,不论数据集是托管、发布在哪个网站、数字图书馆或个人网站,都可以轻松的查找与访问。

为了创建数据集搜索,谷歌为数据集提供了一套指南,以便谷歌(和其他搜索引擎)能够更好地理解其页面的内容。

这套指南主要突出了数据集以下方面的信息:

  • 数据集的创建者
  • 数据集发布时间
  • 数据集搜集方法
  • 数据集使用条款
  • ......

然后,谷歌收集并且链接这一信息,对不同版本的同一数据集做分析,并找到描述或讨论数据集的出版物。

谷歌的方法基于一个开放标准(schema.org),任何发布数据的人都可以采用上述方式对他们的数据集做描述。

在这个新版本中,用户可以找到有关环境和社会科学的大多数数据集的引用,以及来自其他学科的数据(包括政府数据和新闻机构提供的数据)。随着越来越多的数据存储库使用schema.org标准来描述它们的数据集,用户在数据集搜索中发现的数据集的多样性和覆盖范围将继续增加。

Dataset Search——抢先体验!

数据集搜索支持多种语言,当然也包括中文。只需输入你要查找的内容,这款神器便将帮助你在存储库提供者的站点上找到已发布的数据集。

例如,如果你想分析每天的天气记录,你可以在数据集搜索中尝试输入daily weather:

正如搜索结果所示,你可以看到来自NASA、NOAA的数据集,同时也是可以看到来自学术存储库的数据,例如哈佛的Dataverse和ICPSR。

正如NOAA的首席数据官Ed Kearns所说:“这种类型的搜索长期以来一直是科学界许多研究人员的梦想!”

但是谷歌方面也表示,像这样的搜索工具只有在数据发布者愿意提供的元数据的基础上才能发挥作用。并呼吁广大数据提供者能够采用schema.org标准来描述数据。

心动不如行动,大家赶快动手去试试吧: https://toolbox.google.com/datasetsearch

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2018-09-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Albert陈凯

大数据实战项目《大型电商日志分析》的知识点大数据实战项目的知识点

大数据实战项目的知识点 1、大数据集群环境的搭建 CentOS 6.8、 hadoop-2.7.3、 hive-0.13.1 zookeeper-3.4....

5108
来自专栏JAVA高级架构开发

有时候,解决问题比写代码更重要!

有时候程序员往往会陷入为了写代码而写代码的怪圈,没有意识到代码是为了解决现实问题的。当问题有更简便的解决方案时,写代码未必就是必须。记住:你不是别人花钱让你在屏...

350
来自专栏CSDN技术头条

大数据架构的未来

作者:Matt Kalan 原文:The Future of Big Data Architecture 译者:孙薇 本文讲述了大数据的相关问题,以及“大数据架...

2197
来自专栏腾讯云数据库(TencentDB)

腾讯智造,新一代云数据库CynosDB,“C”位出道!

CynosDB是腾讯云自研的新一代高性能高可用的企业级分布式云数据库。融合了传统数据库、云计算与新硬件的优势,100%兼容开源数据库,百万级QPS的高吞吐,不限...

4.6K10
来自专栏PPV课数据科学社区

如何快速学习Tableau Desktop

这个要慌,问题有点大! 严格来说我只是Tableau众多粉丝中的一员,而且是一个不怎么会Excel的。三年前一次偶然的机会在领导推荐下接触了Tableau,开始...

5617
来自专栏数据和云

2016数据库大会访谈:杨廷琨谈环境变化优秀DBA会抬头看路

随着科技飞速发展,软硬件技术更新换代,数据库领域也在不断发生着变化,传统数据库与新技术的结合、数据库的云化等等。改变是为了更好的生存发展,数据库...

2754
来自专栏大数据和云计算技术

大数据服务上云的思考

说说大数据怎么上云的一些思考: 1、首先说说,大数据和云的关系。云是一种网络形态的概念,是继1980年代大型计算机到客户端-服务器的大转变之后的又一种巨变。云计...

2938
来自专栏Java学习网

全栈开发工程师就是个神话

全栈开发工程师就是个神话 “全栈开发工程师(full stack developer)”一词经常出现在企业招聘的岗位描述中。但 Hello Pretty 联合创...

3049
来自专栏程序员的知识天地

Facebook的bug终结者!程序员再也不用加班熬夜了!

“如果 Facebook 没有 AI,那它将失去根基。”去年@Scale软件工程大会上,Facebook AML 实验室负责人 Joaquin Candela ...

1463
来自专栏钱曙光的专栏

一周极客热文:程序媛讲述初学程序时应该知道的事

Cecily Carver是多伦多的一位程序媛,和 Jennie Faber 一起创办了一个游戏制作工作室。她喜欢歌剧、舞蹈和弹钢琴。Cecily 在这篇文章分...

1898

扫码关注云+社区