sklearn数据集介绍

击上方

“蓝色字”

可关注我们!

今日分享:数据集

一:数据集划分

机器学习一般的数据集会划分为两个部分:

1、训练数据:用于训练,构建模型。(大家有时也会看到把训练数据划分为训练集和验证集,这往往发生在模型需要交叉验证时,目的是为了寻找更为合适的模型参数)

2、测试数据:在模型检验时使用,用于评估模型是否有效

二:sklearn数据集API介绍

简单介绍几个数据集

(鸢尾花数据集)

(数字数据集)

(波士顿房价数据集)

(糖尿病数据集)

三:sklearn数据集划分API介绍

在学习sklearn中的一些模型时,使用自带的数据集比较方便,除此之外还有别的一些常用的数据集,在以后的推文中会逐一介绍

公众号QQ群

扫QQ群二维码进交流学习群

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181011G0CVWX00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券