前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >30个免费且很棒的公共数据源分享

30个免费且很棒的公共数据源分享

作者头像
IT派
发布于 2018-07-30 08:12:31
发布于 2018-07-30 08:12:31
1K0
举报
文章被收录于专栏:IT派IT派

机器学习人工智能区块链预测分析——所有令人惊叹的技术都承诺将革新商业和社会。

但如果没有数据的话,这些技术就一无是处。所幸的是,对于那些没有资源有条不紊收集每一条有用信息的企业和组织而言,他们可以免费从网上得到庞大(并且不断增加)的数据。

以下是2018年的30个免费在线大数据来源:

1、世界银行开放数据(WorldBankOpenData),是涵盖了全球人口统计数据、大量经济和发展指标的数据集。

2、国际货币基金组织数据(IMFData),国际货币基金组织公布的国际财务状况、债务率、外汇储备、商品价格和投资数据。

3、美国国家教育统计中心(The US National Center for Education Statistics Data),提供了覆盖美国和世界各地的教育机构和教育人口统计的数据。

4、英国数据中心(TheUKDataCentre)是英国最大的社会、经济和人口的数据集。

5、FiveThirtyEight,有大量提供政治和体育问题舆论数据的民意调查。

6、FBI统一犯罪报告(FBIUniformCrimeReporting),联邦调查局负责编辑和出版国家犯罪统计数据,并在国家、州和县级提供免费数据。

7、美国司法局(BureauofJustice),在这里你可以找到关于美国执法机构、监狱、假释和缓刑机构及法院的数据。

8、QlickDataMarket提供免费包,可访问涵盖世界人口、货币、发展指标和天气数据的数据集。

9、美国宇航局外行星存档(NASAExoplanetArchive)的公共数据集涵盖了由美国宇航局空间探索任务收集的行星和恒星数据。

10、联合国贸易数据库(UNComtradeDatabaseStatistics)统计是由联合国汇编并出版的资料,包括ComtradeLab,展示了如何使用尖端分析和工具从数据中提取价值。

11、金融时报市场数据(FinancialTimesMarketData)是关于全球金融市场的最新信息,包括股票价格指数、商品和外汇。

12、谷歌趋势(GoogleTrends)是检查和分析全球互联网上搜索活动和趋势新闻的数据。

13、推特(Twitter),Twitter的优势在于大多数对话都是公开的,这意味着大量的数据可以通过其API获得,谁正在谈论什么,何地、何时以及为什么。

14、谷歌学术(GoogleScholar)包括学术论文、期刊、书籍和法律判例法的文本内容。

15、Instagram,与Twitter一样,Instagram的帖子和对话默认为公开,其API允许对喜欢、提及和商业细节进行分析。

16、OpenCorporates是全球最大的企业开放数据库。

17、GlassdoorAPI提供了有关职位空缺、候选人、薪水和员工满意度的信息,可通过他们的开发者API获得。

18、IMDBDatasets,是从网络上最大的电影、电视和从业人员中获得的多种格式数据集。

19、OpenLibraryDataDumps是关于世界各地图书馆书籍目录的数据集。

20、LabelledFacesintheWild整理并标记了13,000个人脸图像,用于开发涉及面部识别的应用。

21、MicrosoftMarco是微软的开放式机器学习数据集,用于阅读理解和问题回答的培训系统。

22、机器学习数据集知识库(Machine Learning Dataset Repository)由集合了由参与机器学习项目的数据科学家贡献的开放数据集。

23、易趣市场数据洞察(eBayMarketDataInsights)提供了来自eBay的数以百万计的在线销售和拍卖数据。

24、自然历史博物馆数据门户(Natural History Museum Data Portal)提供了关于伦敦博物馆藏品中近400万个历史标本的信息,以及自然世界的科学录音。

25、欧洲核子研究中心开放数据(CERNOpenData),欧洲核子研究中心开展的粒子物理实验提供了超过1PB的数据。

26、OneMillionAudioCoverImages数据集托管在archive.org上,涵盖世界各地发布的音乐,用于图像处理研究

27、CompletePublicRedditCommentsCorpus,2007年至2015年期间在Reddit上发布的10多亿份公共评论,用于训练语言算法。

28、MicrosoftAzureDataMarketsFreeDatasets,提供了涵盖从农业到天气所有内容的免费数据集。

29、IrishElectricVehicleChargePointStatus收集了这个负责爱尔兰共和国和北爱尔兰电动汽车充电站网络数据机构的数据。

30、LondonAir提供了来自伦敦各地的污染和空气质量数据。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-04-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 IT派 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
收集数据太困难?这里为你准备了 71 个免费数据集
日前,KDnuggets 上的一篇文章总结了七十多个免费的数据集,内容涉及到政府、金融、卫生、新闻传媒等各个方面,除了这些数据,文中还提供数据提取地址。 AI 研习社将文章编译整理如下。原文链接:http://t.cn/RQJhwSi。 进行良好的数据可视化的前提是数据的质量较高并且比较干净。大多数人认为收集大量数据是一件很困难的事情,事实并非如此。网上有成千上万的免费数据集,我们可以利用这些数据进行分析和可视化。 下面是 70 多个免费的数据集,涉及到政府、犯罪、卫生、金融和经济数据、市场和社交媒体、新闻
AI研习社
2018/03/16
2.7K0
1分钟链圈 | 蔡文胜:token不应有分红权!你觉得呢?黑客组织窃取5000万美元加密货币
Hi,everybody! 这是2月19日的每日1句话新闻,只需1分钟,让你大年初四也不错过最热门最及时的全球区块链新闻~~ 观点 蔡文胜:token不应有分红权 数学家:“Scriptless S
区块链大本营
2018/05/10
8130
V神亮相北京!未来是程序员的天下
6月3日,在由CSDN和Link Time联合主办的2018以太坊应用大会上,Vitalik Buterin以《Casper与分片技术最新进展》为题做主旨演讲。在现场提问环节,针对“分片技术使用何时能够使用?何时能够成为其验证者?”的问题,Vitalik Buterin表示:“我们希望在1、2个月之后完成这个工作。现在团队已经开始对它进行落地使用,但可能花上一年时间才进行推广,但现在来说还为时过早。”
java架构师
2018/08/23
3620
19个令人大开眼界的可靠消费者研究数据源
译者:董梁 本文长度为3058字,预估阅读时间5分钟。 我们今天要向大家分享19个令人大开眼界的可靠消费者研究数据源。 Kyle的注释: 数据是分享洞察、支持创意和发现意外趋势的有效方法。许多人回避使用数据,觉得数据似乎难以处理和收集。Ritika Puri的这篇文章为您提供了丰富、易于理解和便于访问的数据源。 对于内容营销来说,数据是非常强大的工具。统计数据可以用来支持您所做的陈述,图表可用作可视化内容并吸引受众。几乎所有最受欢迎的信息图都基于数据和统计来传达信息。在阅读本文时,请记录下那些对您的内容营
iCDO互联网数据官
2018/03/05
2.3K0
19个令人大开眼界的可靠消费者研究数据源
2023年将会是波动复苏的一年
展望2023年,全球经济将继续走弱,中国的复苏将无法依赖外部需求。2022年第三、第四季度中国的增长快速放缓就是很明显的预示。2022年10月,国际货币基金组织将2023年的全球增长预测调低至2.7%。最近,他们所描绘的前景更为悲观,认为全球增长率低于2%的可能性大大增加,主要原因是乌克兰冲突持续,欧洲和美国经济同步放缓,甚至可能进入衰退。我们也观察到中国的出口在2022年前9个月保持强劲同比增长,但进入10月份后就开始转弱,11月的同比增长仅为8.8%;这一现象可能会持续到2023年。
heidsoft
2023/03/18
1830
2023年将会是波动复苏的一年
钱塘号丨未来人工智能将带动金融服务如何发展?
导读:人工智能日趋普及,并在金融服务领域产生巨大影响。本文作者 Nikolas Badminton 向我们介绍了人工智能在金融服务领域的发展动向,并对其发展趋势作出自己的预测。 人工智能日趋普及,并在金融服务领域产生巨大影响。本文作者 Nikolas Badminton 向我们介绍了人工智能在金融服务领域的发展动向,并对其发展趋势作出自己的预测。   俗话常说:有钱能使鬼推磨。这是个以付款、投资、保险和数十亿交易为核心的分形经济世界,而这个无章的世界很好地印证了所有自然系统的杂乱复杂性,例如活生物体的极速
钱塘数据
2018/03/02
8540
钱塘号丨未来人工智能将带动金融服务如何发展?
D-News | 柯洁AlphaGo约战四月 中信部规划称中国将建立网络数据安全管理体系
大数据行业近日又发生了哪些大事?D-News每天独家推送大数据行业新闻合集,每天早上五分钟,再也不会错过大新闻~每逢周一您还可以听到新闻内容哦~ 本内容由大数据文摘(BigDataDigest)和数据派(datapi)联合推出,转载要求见文末。 播音栏目同步在【喜马拉雅】频道“大数据文摘”中播出,点击阅读原文订阅收听! D-News团队正在招募喜爱大数据并爱好分享的你~后台回复“dnews”加入我们吧! 摘要:工信部近日印发《信息通信网络与信息安全规划(2016-2020)》,称中国将建立网络数据安全管理体
大数据文摘
2018/05/24
4860
文科生12周培训后成为谷歌大脑AI科学家?当事人说:你想多了
她曾在 fast.ai 上接受过 12 周机器学习兼职课程,这成为了经济学人介绍的重点。不过,Hooker 本人在文章发出之后自己撰文表示:我的成功无法复制。
机器之心
2018/12/06
4760
文科生12周培训后成为谷歌大脑AI科学家?当事人说:你想多了
她曾在 fast.ai 上接受过 12 周机器学习兼职课程,这成为了经济学人介绍的重点。不过,Hooker 本人在文章发出之后自己撰文表示:我的成功无法复制。
IT阅读排行榜
2018/12/05
3660
文科生12周培训后成为谷歌大脑AI科学家?当事人说:你想多了
2022年加密货币的采用,哪些事件推动了行业的发展?
虽然加密市场在2022年受到了一系列破产和日常波动的打击,但在全球范围内,加密货币的采用似乎仍在快速增长。
小将
2023/01/05
4380
2022年加密货币的采用,哪些事件推动了行业的发展?
为什么说稳定币才是诺奖得主哈耶克想要的非国家货币?
营长的朋友圈瞬间被刷屏,各种各样的解读更是铺天盖地。不过,真正促使营长向更深处思考的确是大摩自己的这条 QA:
区块链大本营
2019/03/08
4710
20个可靠的免费的数据源送给你了!
Julie Joyce发文列出了 20 种被广泛认可的免费数据源,其中信息涵盖天文地理、政法医经等,比较全面。不过数据源中的大部分数据集都采集的美国信息,也有少部分是关于其他国家或全球的,你尽可从中筛选自己需要的数据集。
我被狗咬了
2020/07/14
9520
20个可靠的免费的数据源送给你了!
20个安全可靠的免费数据源,各领域数据任你挑
我们都喜欢免费的东西,对吧?实际上,虽然网络上充斥着各种免费信息,但这些信息有时是错误或具有误导性的。但以下这 20 个是被广泛认为相当可信的免费数据源。
昱良
2019/05/15
8450
银行回避加密货币,但行业将从中受益
在最近的银行业危机之后,机构正在将清澈的蓝水置于它们与加密货币行业之间。业界对银行的冷漠应该有多担心?一些分析人士认为,这有长期和短期的好处。
小将
2023/03/30
2300
银行回避加密货币,但行业将从中受益
经济衰退风险加剧,权威机构下调2022年全球芯片销量及半导体支出预期
8月23日消息,随着美联储等主要央行大幅加息,国际地缘政治风险持续上升,全球面临的经济衰退风险也不断加深。在这一背景下,全球芯片市场及半导体资本支出快速降温,其降温幅度料将超过此前预期。
芯智讯
2022/08/25
3380
经济衰退风险加剧,权威机构下调2022年全球芯片销量及半导体支出预期
不知道从哪里找数据?这一篇,都搞定!
相信很多小伙伴在做数据分析或者可视化的时候,经常会遇到——方法工具都有了,但是数据,数据,数据没有啊!
增速可视化
2022/03/07
3.1K0
不知道从哪里找数据?这一篇,都搞定!
资源 | 机器学习高质量数据集大合辑
在机器学习中,寻找数据集也是非常重要的一步。质量高或者相关性高的数据集对模型的训练是非常有帮助的。
磐创AI
2018/11/23
6640
再聊聊我常用的15个数据源网站
前面介绍过实用的效率小工具,真的帮了我很多忙,这次给小伙伴们再种草一些数据源网站。
朱卫军 AI Python
2022/07/06
7870
再聊聊我常用的15个数据源网站
8个带你快速入门的趣味机器学习项目(附数据源、教程)
来源:机械鸡(ID:jixieji2017) 本文长度为3216字,建议阅读6分钟 本文为你介绍八个短时间可以完成的趣味机器学习项目。 抽时间做项目是最好的一种投资方式,在项目中你会享受学习、保持积极性并能获得更快的进展。没有任何理论可以代替实践,虽然教材和课程能让你掌握一些基本原理,但在尝试应用时,你会发现具体操作起来比较困难。 因此项目有助于提高应用机器学习的技巧,此外在找工作中也会给自己增添一些筹码。 以下将具体介绍这八个项目,每个项目都能在一个周末完成,如果你喜欢的话,可以对其进行相关的扩展。
数据派THU
2018/01/30
1.5K0
8个带你快速入门的趣味机器学习项目(附数据源、教程)
真·富可敌国!苹果公司光卖iPhone的收入就比乌克兰GDP还高
今年1月3日,美国股市开市第一天,全球第一家市值冲破3万亿美元的公司就此诞生——苹果。
新智元
2023/01/06
4110
真·富可敌国!苹果公司光卖iPhone的收入就比乌克兰GDP还高
推荐阅读
相关推荐
收集数据太困难?这里为你准备了 71 个免费数据集
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文