AILearning-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

AILearning

专栏成员

89

文章

190115

阅读量

49

订阅数

【Scikit-Learn 中文文档】协方差估计 / 经验协方差 / 收敛协方差 / 稀疏逆协方差 / Robust 协方差估计 - 无监督学习 - 用户指南 | ApacheCN

机器学习 scikit-learn

2.6. 协方差估计许多统计问题在某一时刻需要估计一个总体的协方差矩阵，这可以看作是对数据集散点图形状的估计。大多数情况下，基于样本的估计（基于其属性，如尺寸，结构，均匀性），对估计质量有很大影响。 sklearn.covariance 方法的目的是提供一个能在各种设置下准确估计总体协方差矩阵的工具。我们假设观察是独立的，相同分布的 (i.i.d.)。 2.7. 经验协方差已知数据集的协方差矩阵与经典 maximum likelihood estimator(最大似然估计) （或

2018-01-15

3.3K0

【Scikit-Learn 中文文档】双聚类 - 无监督学习 - 用户指南 | ApacheCN

机器学习 scikit-learn

2.4. 双聚类 Biclustering 可以使用 sklearn.cluster.bicluster 模块。 Biclustering 算法对数据矩阵的行列同时进行聚类。同时对行列进行聚类称之为 biclusters。每一次聚类都会通过原始数据矩阵的一些属性确定一个子矩阵。例如, 一个矩阵 (10, 10) , 一个 bicluster 聚类，有三列二行，就是一个子矩阵 (3, 2) >>> >>> import numpy as np >>> data = np.arange(100).

2018-01-15

2.1K0

【Scikit-Learn 中文文档】内核岭回归 - 监督学习 - 用户指南 | ApacheCN

机器学习 scikit-learn kernel

1.3. 内核岭回归 Kernel ridge regression (KRR) （内核岭回归）[M2012]_ 由使用内核方法的 :ref:`ridge_regression`（岭回归）（使用 l2 正则化的最小二乘法）所组成。因此，它所学习到的在空间中不同的线性函数是由不同的内核和数据所导致的。对于非线性的内核，它与原始空间中的非线性函数相对应。 Screenshot (39).png 下图比较了人造数据集上的 KernelRidge 和 SVR 的区别，它由一个正弦目标函数和每五个数据点产生

2018-01-15

8240

【Scikit-Learn 中文文档】分解成分中的信号（矩阵分解问题） - 无监督学习 - 用户指南 | ApacheCN

机器学习 scikit-learn apache

2.5. 分解成分中的信号（矩阵分解问题） 2.5.1. 主成分分析（PCA） 2.5.1.1. 准确的PCA和概率解释（Exact PCA and probabilistic interpretation） PCA 用于对一组连续正交分量中的多变量数据集进行方差最大方向的分解。在 scikit-learn 中， PCA 被实现为一个变换对象，通过 fit 方法可以降维成 n 个成分，并且可以将新的数据投影(project, 亦可理解为分解)到这些成分中。可选参数 whiten=Tr

2018-01-15

1.2K0

【Scikit-Learn 中文文档】集成方法 - 监督学习 - 用户指南 | ApacheCN

数据处理机器学习 scikit-learn

1.11. 集成方法注意，在本文中 bagging 和 boosting 为了更好的保留原文意图，不进行翻译estimator->估计器 base estimator->基估计器集成方法的目标是把使用给定学习算法构建的多个基估计器的预测结果结合起来，从而获得比单个估计器更好的泛化能力/鲁棒性。集成方法通常分为两种: 平均方法，该方法的原理是构建多个独立的估计器，然后取它们的预测结果的平均。一般来说组合之后的估计器是会比单个估计器要好的，因为它的方差减小了。示例: Bagging

2018-01-15

2K0

【Scikit-Learn 中文文档】使用 scikit-learn 介绍机器学习 | ApacheCN

机器学习人工智能 scikit-learn

使用 scikit-learn 介绍机器学习 | ApacheCN 内容提要在本节中，我们介绍一些在使用 scikit-learn 过程中用到的机器学习词汇，并且给出一些例子阐释它们。机器学习：问题设置一般来说，一个学习问题通常会考虑一系列 n 个样本数据，然后尝试预测未知数据的属性。如果每个样本是多个属性的数据（比如说是一个多维记录），就说它有许多“属性”，或称 features(特征) 。我们可以将学习问题分为几大类: 监督学习 , 其中数据带有一个附加属性，即我

2018-01-15

1.2K0

【Scikit-Learn 中文文档】高斯混合模型 - 无监督学习 - 用户指南 | ApacheCN

机器学习人工智能 scikit-learn

2.1. 高斯混合模型 sklearn.mixture 是一个应用高斯混合模型进行非监督学习的包，支持 diagonal，spherical，tied，full四种协方差矩阵（注：diagona

2018-01-15

2.4K0

【Scikit-Learn 中文文档】聚类 - 无监督学习 - 用户指南 | ApacheCN

机器学习 scikit-learn

2.3. 聚类未标记的数据的 Clustering（聚类）可以使用模块 sklearn.cluster 来实现。每个 clustering algorithm （聚类算法）有两个变体: 一个是 class, 它实现了 fit 方法来学习 train data（训练数据）的 clusters（聚类），还有一个 function（函数），是给定 train data（训练数据），返回与不同 clusters（聚类）对应的整数标签 array（数组）。对于 class（类），training dat

2018-01-15

5.4K0

【机器学习实战】第14章利用SVD简化数据

第14章利用SVD简化数据 <script type="text/javascript" src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?

2018-01-15

1.5K0

【Scikit-Learn 中文文档】概率校准 - 监督学习 - 用户指南 | ApacheCN

机器学习 scikit-learn

1.16. 概率校准执行分类时, 您经常希望不仅可以预测类标签, 还要获得相应标签的概率. 这个概率给你一些预测的信心. 一些模型可以给你贫乏的概率估计, 有些甚至不支持概率预测. 校准模块可以让您更好地校准给定模型的概率, 或添加对概率预测的支持. 精确校准的分类器是概率分类器, 其可以将 predict_proba 方法的输出直接解释为 confidence level（置信度级别）. 例如，一个经过良好校准的（二元的）分类器应该对样本进行分类, 使得在给出一个接近 0.8 的 predicti

2018-01-15

1.5K0

【机器学习实战】第11章使用 Apriori 算法进行关联分析

机器学习编程算法

第 11 章使用 Apriori 算法进行关联分析关联分析关联分析是一种在大规模数据集中寻找有趣关系的任务。这些关系可以有两种形式: 频繁项集（frequent item sets）: 经常

2018-01-15

1.8K0

【机器学习实战】第5章 Logistic回归

机器学习数据处理

本文介绍了如何使用机器学习算法对马匹进行疾病预测。首先介绍了数据集构建和预处理，然后详细阐述了基于逻辑回归的疾病预测模型。最后，通过实验证明了该模型在预测马匹疾病方面的可行性。

2018-01-05

1.2K0

【Scikit-Learn 中文文档】朴素贝叶斯 - 监督学习 - 用户指南 | ApacheCN

机器学习 scikit-learn

本文介绍了朴素贝叶斯算法在机器学习领域的一些应用，包括文档分类、垃圾邮件过滤、情感分析等。同时，文章还介绍了如何使用高斯朴素贝叶斯、多项式朴素贝叶斯和伯努利朴素贝叶斯进行分类。

2018-01-05

1.1K0

【机器学习实战】第13章利用 PCA 来简化数据

机器学习数据处理

本文介绍了降维技术及其在机器学习中的应用，包括主成分分析（PCA）、独立成分分析（ICA）、奇异值分解（SVD）等方法。同时，本文还介绍了降维技术在数据挖掘、自然语言处理、计算机视觉等领域的应用案例。

2018-01-05

9430

【机器学习实战】第9章树回归

机器学习 linux

2018-01-05

1.2K0

【机器学习实战】第4章基于概率论的分类方法：朴素贝叶斯

机器学习编程算法

文章主要介绍了如何利用机器学习算法对RSS源进行分类和过滤。首先介绍了RSS源的分类和过滤的必要性，然后详细介绍了基于机器学习算法的RSS源过滤方法，包括特征提取、模型训练和过滤策略等。最后，介绍了一个基于机器学习算法的RSS源过滤系统的设计与实现。

2018-01-05

1.7K0

【机器学习实战】第8章预测数值型数据：回归

机器学习数据处理

2018-01-05

1.9K0

【机器学习实战】第15章大数据与MapReduce

机器学习大数据 linux mapreduce

本文介绍了如何使用 MapReduce 实现基于 PEGASOS 算法的 SVM，通过在 Hadoop 集群上使用 MRJob 来实现分布式训练，并利用 Cascading 和 Oozie 进行作业管理。

2018-01-05

1.2K0

【Scikit-Learn 中文文档】广义线性模型 - 监督学习 - 用户指南 | ApacheCN

机器学习数据处理人工智能

根据给定的文章内容，撰写摘要总结。

2018-01-05

1.7K0

【Scikit-Learn 中文文档】决策树 - 监督学习 - 用户指南 | ApacheCN

机器学习 scikit-learn 监督学习

本文介绍了机器学习中的决策树算法，包括基本概念、原理、优缺点以及决策树的应用场景。同时，还介绍了scikit-learn库中的决策树实现，以及如何使用该库进行机器学习。

2018-01-05

1.6K0

点击加载更多

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态