前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >推荐一些数据集

推荐一些数据集

作者头像
double
发布2019-05-16 14:37:00
1.5K0
发布2019-05-16 14:37:00
举报
文章被收录于专栏:算法channel算法channel

我们平时经常遇到去哪里下载数据的问题,想必你也为找到想要的数据而颇费周折,我也经常花费不少精力在寻找数据。这几天,特意检索了下,以下所列都可正常打开。

1、农业相关

https://www.plants.usda.gov/dl_all.html

2、生物学相关

1000 Genomes:http://www.internationalgenome.org/data

细胞实验室,1万个数据集,2T 数据:http://www.cellimagelibrary.org/home

癌细胞百科全书(CCLE):https://portals.broadinstitute.org/ccle

3、天气

世界气候:http://www.worldclim.org/

1929后世界各地天气:https://en.tutiempo.net/climate

4、地理

地球相关:http://www.earthmodels.org/

世界各国:https://github.com/mledoze/countries

世界开源地图OSM: https://www.openstreetmap.org/

地图数据:http://www.naturalearthdata.com/

5、健康

健康大数据:https://www.ehdp.com/vitalnet/datasets.htm

世界健康组织:https://www.who.int/gho/en/

6、网络数据

论文引用关系数据集:https://www.aminer.cn/citation

穷举之密码字典:https://github.com/duyetdev/bruteforce-database

7、经济学

数据世界:https://ourworldindata.org/

数据中心:https://cid.econ.ucdavis.edu/

世界公司大全:https://opencorporates.com/

8、图像处理

imageNet: http://www.image-net.org/

动物情感:http://www.imageemotion.org/

YouTube 面部识别:http://www.cs.tau.ac.il/~wolf/ytfaces/

室内场景识别:http://web.mit.edu/torralba/www/indoor.html

狗数据集:http://vision.stanford.edu/aditya86/ImageNetDogs/

人脸:https://talhassner.github.io/home/projects/Adience/Adience-data.html

人脸:http://vis-www.cs.umass.edu/lfw/

9、机器学习

ebay在线交易数据:http://www.modelingonlineauctions.com/datasets

互联网电影资料库(IMDB):https://www.imdb.com/interfaces/

keel 数据集:https://sci2s.ugr.es/keel/datasets.php

机器学习的数据库:http://mldata.org/

音乐数据集:http://millionsongdataset.com/

UCI数据集市(473个数据集):http://archive.ics.uci.edu/ml/index.php

10、自然语言处理

博客语料库:http://u.cs.biu.ac.il/~koppel/BlogCorpus.htm

CLiPS Stylometry Investigation 语料:

https://www.clips.uantwerpen.be/datasets/csi-corpus

Google Books Ngrams:https://aws.amazon.com/datasets/google-books-ngrams/

机器翻译:http://statmt.org/wmt11/translation-task.html#download

11、社区网络

github 记录大全:https://www.gharchive.org/

google scholar 引用关系:http://www3.cs.stonybrook.edu/~leman/data/gscholar.db


以上数据集我们都可在内网打开,不需要借助V**,希望能帮助到你. 如果你还知道更多数据集,欢迎留言区中列一下,共享给大家。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-05-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 程序员郭震zhenguo 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • CLiPS Stylometry Investigation 语料:
  • https://www.clips.uantwerpen.be/datasets/csi-corpus
  • Google Books Ngrams:https://aws.amazon.com/datasets/google-books-ngrams/
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档