前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >4,数据的获取

4,数据的获取

作者头像
lyhue1991
发布2020-07-20 11:30:36
7390
发布2020-07-20 11:30:36
举报

sklearn 数据集一览

类型

获取方式

自带的小数据集

sklearn.datasets.load_...

在线下载的数据集

sklearn.datasets.fetch_...

计算机生成的数据集

sklearn.datasets.make_...

svmlight/libsvm格式的数据集

sklearn.datasets.load_svmlight_file(...)

mldata.org在线下载数据集

sklearn.datasets.fetch_mldata(...)

自带的小数据集:

  • 鸢尾花数据集:load_iris() 可用于分类 和 聚类
  • 乳腺癌数据集:load_breast_cancer() 可用于分类
  • 手写数字数据集:load_digits() 可用于分类
  • 糖尿病数据集:load_diabetes() 可用于分类
  • 波士顿房价数据集:load_boston() 可用于回归
  • 体能训练数据集: load_linnerud() 可用于回归
  • 图像数据集: load_sample_image(name)

计算机生成的数据集:

  • make_blobs 可用于聚类和分类
  • make_classification 可用于分类
  • make_circles 可用于分类
  • make_moons 可用于分类
  • make_multilabel_classification 可用于多标签分类
  • make_regression 可用于回归

一,自带的小数据集

二,计算机生成的数据集

使用计算机生成数据集的优点:

  • 非常灵活:可以控制样本数量,特征数量,类别数量,问题难易程度等等。
  • 无穷无尽:妈妈再也不用担心我没有数据集了。

可以在学习其他机器学习模块如tensorflow时使用sklearn的数据集

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-07-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 算法美食屋 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一,自带的小数据集
  • 二,计算机生成的数据集
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档