Scikit-learn快速入门教程和实例(一)

关于作者:林夕是四川电子科技大学的研究生,主要研究方向是数据分析,机器学习。

一,什么是SKlearn

SciKit learn的简称是SKlearn,是一个python库,专门用于机器学习的模块。

以下是它的官方网站,文档等资源都可以在里面找到http://scikit-learn.org/stable/#。SKlearn包含的机器学习方式:

分类,回归,无监督,数据降维,数据预处理等等,包含了常见的大部分机器学习方法。

关于SKlearn的安装,网上教程很多,再次不赘述。建议使用Anaconda,可以方便的安装各种库。Anaconda教程:http://python.jobbole.com/87522/

SKlearn给出了如何选择正确的方法:

官网清晰图:http://scikit-learn.org/stable/tutorial/machine_learning_map/index.html

图表对于什么样的问题,采用什么样的方法给出了清晰的描述,包括数据量不同的区分。

二,SKlearn的强大数据库

数据库网址:http://scikit-learn.org/stable/modules/classes.html#module-sklearn.datasets

里面包含了很多数据,可以直接拿来使用。

例如:

1.鸢尾花数据集

打开里面的鸢尾花数据集,我们可以看到页面上同样有调用示例:

2.波士顿房价数据集

而且在SKlearn官网,对于每一个数据集,在后面都给出了,使用该数据集的示例,例如Boston房价数据集:

三,通用学习模式

SKlearn中学习模式的调用,有很强的统一性,很多都是类似的,学会一个,其他基本差不多。

1.鸢尾花数据集

针对上述已经导入的鸢尾花数据集,继续对其进行分析。

2.波士顿房价数据集

这里,我们调用房价数据集,然后使用线性回归的方法对其进行预测

以上众多内容,参照莫烦教程

更详细的内容可以去他官网查看。https://morvanzhou.github.io/

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180816A0EMFW00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券