前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >谷歌强力推出数据集搜索!Dataset Search神器重磅来袭

谷歌强力推出数据集搜索!Dataset Search神器重磅来袭

作者头像
新智元
发布2018-09-25 14:48:29
7420
发布2018-09-25 14:48:29
举报
文章被收录于专栏:新智元新智元

新智元报道

来源:blog.google

编辑:三石

【新智元导读】继Google学术搜索之后,谷歌又一神作——Dataset Search重磅来袭!

千呼万唤始出来!Google Dataset Search腾空出世了!

还记得曾经的你,在做科研的时候,为了得到一份儿数据集,绞尽脑汁各种百度、各种google,但结果往往一无所获。从今儿起,再也不用担心这个问题了!

谷歌超级重磅神器来也:

Dataset Search——数据集搜索领跑者

数据,可以说是当今世界众多科学家与工作人员赖以生存的一片沃土。而在网络中存在成千上万个数据存储库,科研人员亦可以访问及使用这些数据集。

为了方便科学家和数据相关研究、工作人员能够轻松访问这些数据,谷歌启动了“数据集搜索(Dataset Search)”。

与谷歌Scholar工作方式类似,不论数据集是托管、发布在哪个网站、数字图书馆或个人网站,都可以轻松的查找与访问。

为了创建数据集搜索,谷歌为数据集提供了一套指南,以便谷歌(和其他搜索引擎)能够更好地理解其页面的内容。

这套指南主要突出了数据集以下方面的信息:

  • 数据集的创建者
  • 数据集发布时间
  • 数据集搜集方法
  • 数据集使用条款
  • ......

然后,谷歌收集并且链接这一信息,对不同版本的同一数据集做分析,并找到描述或讨论数据集的出版物。

谷歌的方法基于一个开放标准(schema.org),任何发布数据的人都可以采用上述方式对他们的数据集做描述。

在这个新版本中,用户可以找到有关环境和社会科学的大多数数据集的引用,以及来自其他学科的数据(包括政府数据和新闻机构提供的数据)。随着越来越多的数据存储库使用schema.org标准来描述它们的数据集,用户在数据集搜索中发现的数据集的多样性和覆盖范围将继续增加。

Dataset Search——抢先体验!

数据集搜索支持多种语言,当然也包括中文。只需输入你要查找的内容,这款神器便将帮助你在存储库提供者的站点上找到已发布的数据集。

例如,如果你想分析每天的天气记录,你可以在数据集搜索中尝试输入daily weather:

正如搜索结果所示,你可以看到来自NASA、NOAA的数据集,同时也是可以看到来自学术存储库的数据,例如哈佛的Dataverse和ICPSR。

正如NOAA的首席数据官Ed Kearns所说:“这种类型的搜索长期以来一直是科学界许多研究人员的梦想!”

但是谷歌方面也表示,像这样的搜索工具只有在数据发布者愿意提供的元数据的基础上才能发挥作用。并呼吁广大数据提供者能够采用schema.org标准来描述数据。

心动不如行动,大家赶快动手去试试吧: https://toolbox.google.com/datasetsearch

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-09-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 【新智元导读】继Google学术搜索之后,谷歌又一神作——Dataset Search重磅来袭!
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档