估计器接口小结摘自:《Python 机器学习基础教程》 第3章 无监督学习与预处理(三)

scikit-learn 中的所有算法——无论是预处理、监督学习还是无监督学习算法——都被实现为类。这些类在 scikit-learn 中叫作估计器(estimator)。为了应用算法,你首先需要将特定类的对象实例化:

from sklearn.linear_model import LogisticRegression
logreg = LogisticRegression()

估计器类包含算法,也保存了利用算法从数据中学到的模型。

在构建模型对象时,你应该设置模型的所有参数。这些参数包括正则化、复杂度控制、要找到的簇的数量,等等。所有估计器都有fit方法,用于构建模型。fit方法要求第一个参数总是数据X,用一个NumPy数组或 SciPy稀疏矩阵表示,其中每一行代表一个数据点。数据 X 总被假定为具有连续值(浮点数)的 NumPy数组或 SciPy 稀疏矩阵。监督算法还需要有一个 y参数,它是一维NumPy数组,包含回归或分类的目标值(即已知的输出标签或响应)。

scikit-learn中,应用学到的模型主要有两种方法。要想创建一个新输出形式(比如 y)的预测,可以用 predict方法。要想创建输入数据 X的一种新表示,可以用 transform方法。表汇总了predict方法和 transform方法的使用场景。

表:scikit-learn API小结

estimator.fit(X_train, [y_train])

estimator.predict(X_test)

estimator.transform(X_test)

分类

预处理

回归

降维

聚类

特征提取

特征选择

此外,所有监督模型都有 score(X_test, y_test) 方法,可以评估模型。在表中,X_trainy_train 指的是训练数据和训练标签,而X_testy_test 指的是测试数据和测试标签(如果适用的话)。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏杨熹的专栏

神经网络 之 线性单元

本文结构: 什么是线性单元 有什么用 代码实现 ---- 1. 什么是线性单元 线性单元和感知器的区别就是在激活函数: ? 感知器的 f 是阶越函数: ? 线性...

34040
来自专栏数值分析与有限元编程

可视化 | MATLAB划分均匀矩形网格

之前发过一个划分均匀三角形网格的例子。下面结合一个悬臂梁说说如何在规则区域划分均匀矩形网格。 ? 将一个矩形平面区域划分成相同大小的矩形。X方向等分nex,Y方...

57690
来自专栏null的专栏

机器学习算法实现解析——libFM之libFM的模型处理部分

本节主要介绍的是libFM源码分析的第三部分——libFM的模型处理。 3.1、libFM中FM模型的定义 libFM模型的定义过程中主要包括模型中参数的设置及...

56390
来自专栏mantou大数据

[机器学习实战]K-近邻算法

1. K-近邻算法概述(k-Nearest Neighbor,KNN) K-近邻算法采用测量不同的特征值之间的距离方法进行分类。该方法的思路是:如果一个样本在特...

47050
来自专栏深度学习那些事儿

风格迁移中直方图匹配(Histogram Match)的作用-附pytorch直方图匹配代码

风格迁移是神经网络深度学习中比较重要且有趣的一个项目。如果不知道什么是风格迁移的请参考这篇文章:https://oldpan.me/archives/pytor...

1.4K50
来自专栏用户2442861的专栏

python感知机实现

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/haluoluo211/article/d...

33740
来自专栏AI研习社

手把手教你用 TensorFlow 实现卷积神经网络(附代码)

在知乎上看到一段介绍卷积神经网络的文章,感觉讲的特别直观明了,我整理了一下。首先介绍原理部分。 通过一个图像分类问题介绍卷积神经网络是如何工作的。下面是卷积神经...

36860
来自专栏李智的专栏

Python针对图像的基础操作

5. 返回目录中所有JPG 图像的文件名列表,直方图均衡化,平均图像,主成分分析等

17520
来自专栏深度学习那些事儿

风格迁移(Style Transfer)中直方图匹配(Histogram Match)的作用

风格迁移是神经网络深度学习中比较重要且有趣的一个项目。如果不知道什么是风格迁移的请参考这篇文章:https://oldpan.me/archives/pytor...

624140
来自专栏Petrichor的专栏

opencv: 获取 图像属性 (源码)

  说明了读取的图片是一张 大小 为 (424, 600, 3) ,数据类型 为 uint8 ,像素总数 为 763200 的图片。

22810

扫码关注云+社区

领取腾讯云代金券