30个免费且很棒的公共数据源分享

机器学习、人工智能、区块链、预测分析——所有令人惊叹的技术都承诺将革新商业和社会。

但如果没有数据的话,这些技术就一无是处。所幸的是,对于那些没有资源有条不紊收集每一条有用信息的企业和组织而言,他们可以免费从网上得到庞大(并且不断增加)的数据。

以下是2018年的30个免费在线大数据来源:

1、世界银行开放数据(WorldBankOpenData),是涵盖了全球人口统计数据、大量经济和发展指标的数据集。

2、国际货币基金组织数据(IMFData),国际货币基金组织公布的国际财务状况、债务率、外汇储备、商品价格和投资数据。

3、美国国家教育统计中心(The US National Center for Education Statistics Data),提供了覆盖美国和世界各地的教育机构和教育人口统计的数据。

4、英国数据中心(TheUKDataCentre)是英国最大的社会、经济和人口的数据集。

5、FiveThirtyEight,有大量提供政治和体育问题舆论数据的民意调查。

6、FBI统一犯罪报告(FBIUniformCrimeReporting),联邦调查局负责编辑和出版国家犯罪统计数据,并在国家、州和县级提供免费数据。

7、美国司法局(BureauofJustice),在这里你可以找到关于美国执法机构、监狱、假释和缓刑机构及法院的数据。

8、QlickDataMarket提供免费包,可访问涵盖世界人口、货币、发展指标和天气数据的数据集。

9、美国宇航局外行星存档(NASAExoplanetArchive)的公共数据集涵盖了由美国宇航局空间探索任务收集的行星和恒星数据。

10、联合国贸易数据库(UNComtradeDatabaseStatistics)统计是由联合国汇编并出版的资料,包括ComtradeLab,展示了如何使用尖端分析和工具从数据中提取价值。

11、金融时报市场数据(FinancialTimesMarketData)是关于全球金融市场的最新信息,包括股票价格指数、商品和外汇。

12、谷歌趋势(GoogleTrends)是检查和分析全球互联网上搜索活动和趋势新闻的数据。

13、推特(Twitter),Twitter的优势在于大多数对话都是公开的,这意味着大量的数据可以通过其API获得,谁正在谈论什么,何地、何时以及为什么。

14、谷歌学术(GoogleScholar)包括学术论文、期刊、书籍和法律判例法的文本内容。

15、Instagram,与Twitter一样,Instagram的帖子和对话默认为公开,其API允许对喜欢、提及和商业细节进行分析。

16、OpenCorporates是全球最大的企业开放数据库。

17、GlassdoorAPI提供了有关职位空缺、候选人、薪水和员工满意度的信息,可通过他们的开发者API获得。

18、IMDBDatasets,是从网络上最大的电影、电视和从业人员中获得的多种格式数据集。

19、OpenLibraryDataDumps是关于世界各地图书馆书籍目录的数据集。

20、LabelledFacesintheWild整理并标记了13,000个人脸图像,用于开发涉及面部识别的应用。

21、MicrosoftMarco是微软的开放式机器学习数据集,用于阅读理解和问题回答的培训系统。

22、机器学习数据集知识库(Machine Learning Dataset Repository)由集合了由参与机器学习项目的数据科学家贡献的开放数据集。

23、易趣市场数据洞察(eBayMarketDataInsights)提供了来自eBay的数以百万计的在线销售和拍卖数据。

24、自然历史博物馆数据门户(Natural History Museum Data Portal)提供了关于伦敦博物馆藏品中近400万个历史标本的信息,以及自然世界的科学录音。

25、欧洲核子研究中心开放数据(CERNOpenData),欧洲核子研究中心开展的粒子物理实验提供了超过1PB的数据。

26、OneMillionAudioCoverImages数据集托管在archive.org上,涵盖世界各地发布的音乐,用于图像处理研究

27、CompletePublicRedditCommentsCorpus,2007年至2015年期间在Reddit上发布的10多亿份公共评论,用于训练语言算法。

28、MicrosoftAzureDataMarketsFreeDatasets,提供了涵盖从农业到天气所有内容的免费数据集。

29、IrishElectricVehicleChargePointStatus收集了这个负责爱尔兰共和国和北爱尔兰电动汽车充电站网络数据机构的数据。

30、LondonAir提供了来自伦敦各地的污染和空气质量数据。

原文发布于微信公众号 - IT派(transfer_3255716726)

原文发表时间:2018-04-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏java一日一条

分享纯技术创业过程最苦逼的那段历程

从2010年依靠插件框架创业至今,已有不少年头了。看着我们以前刚创业的照片不禁有感而发,跟大家来分享一下我们创业最苦逼的那段历史。

14820
来自专栏腾讯大讲堂的专栏

让设计有感知

用户体验设计很多时候是一件看起来有点玄奥的东西,工作中会有这样的讨论 “我觉得这个方案不好。” “但我觉得OK。” “我觉得图片放右边比较好,美观。” “但我觉...

29070
来自专栏腾讯大讲堂的专栏

腾讯正在参与制定一个国际标准,让看片儿更简单

40550
来自专栏腾讯高校合作

2017年腾讯公司创新创业联合基金项目申报指南(第二批)

在教育部指导下,2017年腾讯公司创新创业联合基金项目将配合教育部鼓励大学生创新创业的指导精神,面向全国各大高校开展移动互联网创新创业项目训练计划。 1. 建设...

32950
来自专栏互联网数据官iCDO

iCDO一周数据要闻:谷歌关闭个人版Google+;广告商在亚马逊的广告预算增长率高达三位数;微软将推游戏流媒体服务

10月7日,据悉,英国财政大臣菲利普-哈蒙德(Philip Hammond)正在起草一项针对广告收入征收新数字税的计划,此举将对谷歌和Facebook造成影响,...

10620
来自专栏PPV课数据科学社区

大数据越来越数据,数据到你只知道是个数据?

?   也许这真是一个大数据的年代。你看,各大论坛上专家们在演讲大数据时,哪个不是一脸憧憬、慷慨陈词?但是呢?听众却总是一头雾水、不知所云,只道专家牛逼,越是...

30050
来自专栏UAI人工智能

【召唤Legend Writer】这个世界正在召唤人工智能的”传奇写手“,你会书写下一个legend吗?

14950
来自专栏Android先生

Android应届生在杭州的求职经历

2018年毕业于一个普通的二本院校,向大厂扔过几次简历,就跟打水漂一样,最终沉底,从上海离职到杭州,对于一个应届生来说是一次艰难的选择,更稳妥的方式应该是在实习...

8220
来自专栏腾讯技术工程官方号的专栏

胡珀:从危到机,AI 时代下的安全挑战

作为国内最大的社交巨头,腾讯如何运用AI 技术应对安全挑战?AI时代下,安全攻防又有哪些新变化?

9.6K20
来自专栏腾讯研究院的专栏

下一代互联网发展概述

张孝荣  腾讯研究院总监 王一博  腾讯研究院助理研究员  下一代网络,又称新一代网络。从广义上来说,泛指下一代融合网,泛指不同于当前的,大量采用新技...

41040

扫码关注云+社区

领取腾讯云代金券