首页
学习
活动
专区
工具
TVP
发布

AILearning

专栏作者
89
文章
184292
阅读量
48
订阅数
【Scikit-Learn 中文文档】多类和多标签算法 - 监督学习 - 用户指南 | ApacheCN
中文文档: http://sklearn.apachecn.org/cn/stable/modules/multiclass.html 英文文档: http://sklearn.apachecn.org/en/stable/modules/multiclass.html 官方文档: http://scikit-learn.org/stable/ GitHub: https://github.com/apachecn/scikit-learn-doc-zh(觉得不错麻烦给个 Star,我们一直在努力
片刻
2018-03-12
2.6K0
【Scikit-Learn 中文文档】协方差估计 / 经验协方差 / 收敛协方差 / 稀疏逆协方差 / Robust 协方差估计 - 无监督学习 - 用户指南 | ApacheCN
2.6. 协方差估计 许多统计问题在某一时刻需要估计一个总体的协方差矩阵,这可以看作是对数据集散点图形状的估计。 大多数情况下,基于样本的估计(基于其属性,如尺寸,结构,均匀性), 对估计质量有很大影响。 sklearn.covariance 方法的目的是 提供一个能在各种设置下准确估计总体协方差矩阵的工具。 我们假设观察是独立的,相同分布的 (i.i.d.)。 2.7. 经验协方差 已知数据集的协方差矩阵与经典 maximum likelihood estimator(最大似然估计) (或
片刻
2018-01-15
3.1K0
【Scikit-Learn 中文文档】双聚类 - 无监督学习 - 用户指南 | ApacheCN
2.4. 双聚类 Biclustering 可以使用 sklearn.cluster.bicluster 模块。 Biclustering 算法对数据矩阵的行列同时进行聚类。 同时对行列进行聚类称之为 biclusters。 每一次聚类都会通过原始数据矩阵的一些属性确定一个子矩阵。 例如, 一个矩阵 (10, 10) , 一个 bicluster 聚类,有三列二行,就是一个子矩阵 (3, 2) >>> >>> import numpy as np >>> data = np.arange(100).
片刻
2018-01-15
2K0
【Scikit-Learn 中文文档】内核岭回归 - 监督学习 - 用户指南 | ApacheCN
1.3. 内核岭回归 Kernel ridge regression (KRR) (内核岭回归)[M2012]_ 由 使用内核方法的 :ref:`ridge_regression`(岭回归)(使用 l2 正则化的最小二乘法)所组成。因此,它所学习到的在空间中不同的线性函数是由不同的内核和数据所导致的。对于非线性的内核,它与原始空间中的非线性函数相对应。 Screenshot (39).png 下图比较了人造数据集上的 KernelRidge 和 SVR 的区别,它由一个正弦目标函数和每五个数据点产生
片刻
2018-01-15
7770
【Scikit-Learn 中文文档】分解成分中的信号(矩阵分解问题) - 无监督学习 - 用户指南 | ApacheCN
2.5. 分解成分中的信号(矩阵分解问题) 2.5.1. 主成分分析(PCA) 2.5.1.1. 准确的PCA和概率解释(Exact PCA and probabilistic interpretation) PCA 用于对一组连续正交分量中的多变量数据集进行方差最大方向的分解。 在 scikit-learn 中, PCA 被实现为一个变换对象, 通过 fit 方法可以降维成 n 个成分, 并且可以将新的数据投影(project, 亦可理解为分解)到这些成分中。 可选参数 whiten=Tr
片刻
2018-01-15
1.1K0
【Scikit-Learn 中文文档】集成方法 - 监督学习 - 用户指南 | ApacheCN
1.11. 集成方法 注意,在本文中 bagging 和 boosting 为了更好的保留原文意图,不进行翻译estimator->估计器 base estimator->基估计器 集成方法 的目标是把使用给定学习算法构建的多个基估计器的预测结果结合起来,从而获得比单个估计器更好的泛化能力/鲁棒性。 集成方法通常分为两种: 平均方法,该方法的原理是构建多个独立的估计器,然后取它们的预测结果的平均。一般来说组合之后的估计器是会比单个估计器要好的,因为它的方差减小了。 示例: Bagging
片刻
2018-01-15
1.9K0
【Scikit-Learn 中文文档】使用 scikit-learn 介绍机器学习 | ApacheCN
使用 scikit-learn 介绍机器学习 | ApacheCN 内容提要 在本节中,我们介绍一些在使用 scikit-learn 过程中用到的 机器学习 词汇,并且给出一些例子阐释它们。 机器学习:问题设置 一般来说,一个学习问题通常会考虑一系列 n 个 样本 数据,然后尝试预测未知数据的属性。 如果每个样本是 多个属性的数据 (比如说是一个多维记录),就说它有许多“属性”,或称 features(特征) 。 我们可以将学习问题分为几大类: 监督学习 , 其中数据带有一个附加属性,即我
片刻
2018-01-15
1.2K0
【Scikit-Learn 中文文档】高斯混合模型 - 无监督学习 - 用户指南 | ApacheCN
2.1. 高斯混合模型 sklearn.mixture 是一个应用高斯混合模型进行非监督学习的包,支持 diagonal,spherical,tied,full四种协方差矩阵 (注:diagona
片刻
2018-01-15
2.3K0
【Scikit-Learn 中文文档】聚类 - 无监督学习 - 用户指南 | ApacheCN
2.3. 聚类 未标记的数据的 Clustering(聚类) 可以使用模块 sklearn.cluster 来实现。 每个 clustering algorithm (聚类算法)有两个变体: 一个是 class, 它实现了 fit 方法来学习 train data(训练数据)的 clusters(聚类),还有一个 function(函数),是给定 train data(训练数据),返回与不同 clusters(聚类)对应的整数标签 array(数组)。对于 class(类),training dat
片刻
2018-01-15
5.2K0
【Scikit-Learn 中文文档】概率校准 - 监督学习 - 用户指南 | ApacheCN
1.16. 概率校准 执行分类时, 您经常希望不仅可以预测类标签, 还要获得相应标签的概率. 这个概率给你一些预测的信心. 一些模型可以给你贫乏的概率估计, 有些甚至不支持概率预测. 校准模块可以让您更好地校准给定模型的概率, 或添加对概率预测的支持. 精确校准的分类器是概率分类器, 其可以将 predict_proba 方法的输出直接解释为 confidence level(置信度级别). 例如,一个经过良好校准的(二元的)分类器应该对样本进行分类, 使得在给出一个接近 0.8 的 predicti
片刻
2018-01-15
1.4K0
【Scikit-Learn 中文文档】朴素贝叶斯 - 监督学习 - 用户指南 | ApacheCN
本文介绍了朴素贝叶斯算法在机器学习领域的一些应用,包括文档分类、垃圾邮件过滤、情感分析等。同时,文章还介绍了如何使用高斯朴素贝叶斯、多项式朴素贝叶斯和伯努利朴素贝叶斯进行分类。
片刻
2018-01-05
1K0
【Scikit-Learn 中文文档】线性和二次判别分析 - 监督学习 - 用户指南 | ApacheCN
本文介绍了线性判别分析(LDA)在降维和分类问题中的应用,并提到了相应的优化方法和算法。文章还探讨了LDA在多类分类问题中的使用和收缩方法。
片刻
2018-01-05
1.4K0
sklearn 快速入门 - 0.18 中文翻译
该文章介绍了技术社区中的内容编辑人员所需要掌握的技能和职责,包括文本编辑、校对、内容质量审核、知识审核、合规性审核、社区管理、媒体管理、团队协作和沟通、培训和教育、以及执行和推行政策和流程等。同时,该文章也介绍了技术社区中的内容编辑人员所需要掌握的技能,包括数字素养、语言和写作技能、媒体管理和沟通技能、流程和政策的制定和执行能力、培训和教育能力、团队协作和领导能力等。该文章旨在为技术社区中的内容编辑人员提供实用的指南和参考,以便他们可以更好地履行其职责并推动技术社区的发展。
片刻
2018-01-05
9300
【Scikit-Learn 中文文档】决策树 - 监督学习 - 用户指南 | ApacheCN
本文介绍了机器学习中的决策树算法,包括基本概念、原理、优缺点以及决策树的应用场景。同时,还介绍了scikit-learn库中的决策树实现,以及如何使用该库进行机器学习。
片刻
2018-01-05
1.6K0
【Scikit-Learn 中文文档】半监督学习 - 监督学习 - 用户指南 | ApacheCN
本文介绍了半监督学习在机器学习领域中的相关研究,包括标签传播算法及其在支持向量机、决策树、神经网络等模型中的应用。同时,还探讨了如何使用半监督学习算法解决实际应用中的问题,并介绍了相关的硬件和软件实现方法。
片刻
2018-01-05
1.7K0
【Scikit-Learn 中文文档】神经网络模块(监督的)- 监督学习 - 用户指南 | ApacheCN
本文介绍了如何利用机器学习算法对天气进行预测,并给出了详细的建模步骤和代码示例。主要包括支持向量机、随机森林、神经网络等多种算法,以及使用交叉验证、调参等步骤来优化模型性能。同时,还探讨了如何使用概率校准来提高模型的性能。
片刻
2018-01-05
7670
【Scikit-Learn 中文文档 】安装 scikit-learn | ApacheCN
摘要总结:本文主要介绍了如何安装 scikit-learn 库以及它的贡献者。首先,文章介绍了如何通过 pip 或 conda 安装 scikit-learn,并提供了安装示例。其次,文章列出了 scikit-learn 的贡献者名单,包括其名称、邮箱和贡献的模块。最后,文章提供了贡献者的维护建议,旨在帮助社区成员更好地参与和维护 scikit-learn 项目。
片刻
2018-01-05
1.9K0
sklearn API 文档 - 0.18 中文翻译
所有函数和类的确切API,由docstrings给出。API会为所有功能提供预期类型和允许的功能,以及可用于算法的所有参数。 原文链接 : http://scikit-learn.org/stab
片刻
2018-01-05
3.4K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档