首页
学习
活动
专区
工具
TVP
发布

AILearning

专栏成员
89
文章
189972
阅读量
49
订阅数
【Scikit-Learn 中文文档】协方差估计 / 经验协方差 / 收敛协方差 / 稀疏逆协方差 / Robust 协方差估计 - 无监督学习 - 用户指南 | ApacheCN
2.6. 协方差估计 许多统计问题在某一时刻需要估计一个总体的协方差矩阵,这可以看作是对数据集散点图形状的估计。 大多数情况下,基于样本的估计(基于其属性,如尺寸,结构,均匀性), 对估计质量有很大影响。 sklearn.covariance 方法的目的是 提供一个能在各种设置下准确估计总体协方差矩阵的工具。 我们假设观察是独立的,相同分布的 (i.i.d.)。 2.7. 经验协方差 已知数据集的协方差矩阵与经典 maximum likelihood estimator(最大似然估计) (或
片刻
2018-01-15
3.3K0
【Scikit-Learn 中文文档】双聚类 - 无监督学习 - 用户指南 | ApacheCN
2.4. 双聚类 Biclustering 可以使用 sklearn.cluster.bicluster 模块。 Biclustering 算法对数据矩阵的行列同时进行聚类。 同时对行列进行聚类称之为 biclusters。 每一次聚类都会通过原始数据矩阵的一些属性确定一个子矩阵。 例如, 一个矩阵 (10, 10) , 一个 bicluster 聚类,有三列二行,就是一个子矩阵 (3, 2) >>> >>> import numpy as np >>> data = np.arange(100).
片刻
2018-01-15
2.1K0
【Scikit-Learn 中文文档】内核岭回归 - 监督学习 - 用户指南 | ApacheCN
1.3. 内核岭回归 Kernel ridge regression (KRR) (内核岭回归)[M2012]_ 由 使用内核方法的 :ref:`ridge_regression`(岭回归)(使用 l2 正则化的最小二乘法)所组成。因此,它所学习到的在空间中不同的线性函数是由不同的内核和数据所导致的。对于非线性的内核,它与原始空间中的非线性函数相对应。 Screenshot (39).png 下图比较了人造数据集上的 KernelRidge 和 SVR 的区别,它由一个正弦目标函数和每五个数据点产生
片刻
2018-01-15
8230
【Scikit-Learn 中文文档】分解成分中的信号(矩阵分解问题) - 无监督学习 - 用户指南 | ApacheCN
2.5. 分解成分中的信号(矩阵分解问题) 2.5.1. 主成分分析(PCA) 2.5.1.1. 准确的PCA和概率解释(Exact PCA and probabilistic interpretation) PCA 用于对一组连续正交分量中的多变量数据集进行方差最大方向的分解。 在 scikit-learn 中, PCA 被实现为一个变换对象, 通过 fit 方法可以降维成 n 个成分, 并且可以将新的数据投影(project, 亦可理解为分解)到这些成分中。 可选参数 whiten=Tr
片刻
2018-01-15
1.2K0
【Scikit-Learn 中文文档】集成方法 - 监督学习 - 用户指南 | ApacheCN
1.11. 集成方法 注意,在本文中 bagging 和 boosting 为了更好的保留原文意图,不进行翻译estimator->估计器 base estimator->基估计器 集成方法 的目标是把使用给定学习算法构建的多个基估计器的预测结果结合起来,从而获得比单个估计器更好的泛化能力/鲁棒性。 集成方法通常分为两种: 平均方法,该方法的原理是构建多个独立的估计器,然后取它们的预测结果的平均。一般来说组合之后的估计器是会比单个估计器要好的,因为它的方差减小了。 示例: Bagging
片刻
2018-01-15
2K0
【Scikit-Learn 中文文档】使用 scikit-learn 介绍机器学习 | ApacheCN
使用 scikit-learn 介绍机器学习 | ApacheCN 内容提要 在本节中,我们介绍一些在使用 scikit-learn 过程中用到的 机器学习 词汇,并且给出一些例子阐释它们。 机器学习:问题设置 一般来说,一个学习问题通常会考虑一系列 n 个 样本 数据,然后尝试预测未知数据的属性。 如果每个样本是 多个属性的数据 (比如说是一个多维记录),就说它有许多“属性”,或称 features(特征) 。 我们可以将学习问题分为几大类: 监督学习 , 其中数据带有一个附加属性,即我
片刻
2018-01-15
1.2K0
【Scikit-Learn 中文文档】高斯混合模型 - 无监督学习 - 用户指南 | ApacheCN
2.1. 高斯混合模型 sklearn.mixture 是一个应用高斯混合模型进行非监督学习的包,支持 diagonal,spherical,tied,full四种协方差矩阵 (注:diagona
片刻
2018-01-15
2.4K0
【Scikit-Learn 中文文档】聚类 - 无监督学习 - 用户指南 | ApacheCN
2.3. 聚类 未标记的数据的 Clustering(聚类) 可以使用模块 sklearn.cluster 来实现。 每个 clustering algorithm (聚类算法)有两个变体: 一个是 class, 它实现了 fit 方法来学习 train data(训练数据)的 clusters(聚类),还有一个 function(函数),是给定 train data(训练数据),返回与不同 clusters(聚类)对应的整数标签 array(数组)。对于 class(类),training dat
片刻
2018-01-15
5.4K0
【机器学习实战】第14章 利用SVD简化数据
第14章 利用SVD简化数据 <script type="text/javascript" src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?
片刻
2018-01-15
1.5K0
【Scikit-Learn 中文文档】概率校准 - 监督学习 - 用户指南 | ApacheCN
1.16. 概率校准 执行分类时, 您经常希望不仅可以预测类标签, 还要获得相应标签的概率. 这个概率给你一些预测的信心. 一些模型可以给你贫乏的概率估计, 有些甚至不支持概率预测. 校准模块可以让您更好地校准给定模型的概率, 或添加对概率预测的支持. 精确校准的分类器是概率分类器, 其可以将 predict_proba 方法的输出直接解释为 confidence level(置信度级别). 例如,一个经过良好校准的(二元的)分类器应该对样本进行分类, 使得在给出一个接近 0.8 的 predicti
片刻
2018-01-15
1.5K0
【机器学习实战】第11章 使用 Apriori 算法进行关联分析
第 11 章 使用 Apriori 算法进行关联分析 关联分析 关联分析是一种在大规模数据集中寻找有趣关系的任务。 这些关系可以有两种形式: 频繁项集(frequent item sets): 经常
片刻
2018-01-15
1.8K0
【机器学习实战】第5章 Logistic回归
本文介绍了如何使用机器学习算法对马匹进行疾病预测。首先介绍了数据集构建和预处理,然后详细阐述了基于逻辑回归的疾病预测模型。最后,通过实验证明了该模型在预测马匹疾病方面的可行性。
片刻
2018-01-05
1.2K0
【Scikit-Learn 中文文档】朴素贝叶斯 - 监督学习 - 用户指南 | ApacheCN
本文介绍了朴素贝叶斯算法在机器学习领域的一些应用,包括文档分类、垃圾邮件过滤、情感分析等。同时,文章还介绍了如何使用高斯朴素贝叶斯、多项式朴素贝叶斯和伯努利朴素贝叶斯进行分类。
片刻
2018-01-05
1.1K0
【机器学习实战】第13章 利用 PCA 来简化数据
本文介绍了降维技术及其在机器学习中的应用,包括主成分分析(PCA)、独立成分分析(ICA)、奇异值分解(SVD)等方法。同时,本文还介绍了降维技术在数据挖掘、自然语言处理、计算机视觉等领域的应用案例。
片刻
2018-01-05
9430
【机器学习实战】第9章 树回归
片刻
2018-01-05
1.2K0
【机器学习实战】第4章 基于概率论的分类方法:朴素贝叶斯
文章主要介绍了如何利用机器学习算法对RSS源进行分类和过滤。首先介绍了RSS源的分类和过滤的必要性,然后详细介绍了基于机器学习算法的RSS源过滤方法,包括特征提取、模型训练和过滤策略等。最后,介绍了一个基于机器学习算法的RSS源过滤系统的设计与实现。
片刻
2018-01-05
1.7K0
【机器学习实战】第8章 预测数值型数据:回归
片刻
2018-01-05
1.9K0
【机器学习实战】第15章 大数据与MapReduce
本文介绍了如何使用 MapReduce 实现基于 PEGASOS 算法的 SVM,通过在 Hadoop 集群上使用 MRJob 来实现分布式训练,并利用 Cascading 和 Oozie 进行作业管理。
片刻
2018-01-05
1.2K0
【Scikit-Learn 中文文档】广义线性模型 - 监督学习 - 用户指南 | ApacheCN
根据给定的文章内容,撰写摘要总结。
片刻
2018-01-05
1.7K0
【Scikit-Learn 中文文档】决策树 - 监督学习 - 用户指南 | ApacheCN
本文介绍了机器学习中的决策树算法,包括基本概念、原理、优缺点以及决策树的应用场景。同时,还介绍了scikit-learn库中的决策树实现,以及如何使用该库进行机器学习。
片刻
2018-01-05
1.6K0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档