首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python3机器学习实战学习笔记(十):提升分类器性能利器-AdaBoost

blog.csdn.net/c406495762/article/details/78212124 **转载请注明作者和出处:**http://blog.csdn.net/c406495762 **机器学习知乎专栏...---- 三 AdaBoost AdaBoost算法是基于Boosting思想的机器学习算法,AdaBoost是adaptive boosting(自适应boosting)的缩写,其运行过程如下: 1、...---- 六 在一个难数据集上应用AdaBoost 在《Python3机器学习实战学习笔记(七):Logistic回归实战篇之预测病马死亡率》文章中,我们使用Logistic回归方法训练马疝病数据集...在机器学习中,有一个普遍适用的称为**混淆矩阵(confusion matrix)**的工具,它可以帮助人们更好地了解分类中的错误。...本文出现的所有代码和数据集,均可在我的github上下载,欢迎Follow、Star:https://github.com/Jack-Cherish/Machine-Learning 参考资料: [1] 简单易学的机器学习算法

78610
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    机器学习实战⑴之线性回归预测房价机器学习实战

    机器学习 一般来说,一个学习问题通常会考虑一系列 n 个 样本 数据,然后尝试预测未知数据的属性。...我们可以将学习问题分为几大类: [监督学习]其中数据带有一个附加属性,即我们想要预测的结果值。...训练集和测试集 机器学习是从数据的属性中学习,并将它们应用到新数据的过程。...这就是为什么机器学习中评估算法的普遍实践是把数据分割成 训练集 (我们从中学习数据的属性)和 测试集 (我们测试这些性质)。...机器学习实战 第一步:加载相应包和所需的数据集 我们这里选的是sklearn包,此包是python中比较常用的机器学习集成包,可以满足大多数模型需求。

    91920

    Python3机器学习实战学习笔记(五):朴素贝叶斯实战篇之新浪新闻分类

    Python版本: Python3.x 运行平台: Windows IDE: Sublime text3 一 前言 上篇文章Python3机器学习实战学习笔记(四):朴素贝叶斯基础篇之言论过滤器讲解了朴素贝叶斯的基础知识...jieba已经兼容Python2和Python3,使用如下指令直接安装即可: pip3 install jieba Python中文分词组件使用简单: 官方教程:https://github.com/fxsjy...另外两个函数的使用暂且不再进行扩展,可以自行学习。MultinomialNB假设特征的先验概率为多项式分布,即如下式: ?...这时我们可以把训练集分成若干等分,重复调用partial_fit来一步步的学习训练集,非常方便。GaussianNB和BernoulliNB也有类似的功能。...五 总结 在训练朴素贝叶斯分类器之前,要处理好训练集,文本的清洗还是有很多需要学习的东西。 根据提取的分类特征将文本向量化,然后训练朴素贝叶斯分类器。 去高频词汇数量的不同,对结果也是有影响的的。

    2.1K100

    机器学习算法实战

    ,理论是非常重要的内容,但是持续的理论学习多少会有些审美疲劳,如果读者已经初步学习了之前介绍的关于机器学习的内容的话,那么到这篇文章出现的时候,也至少已经了解了两个机器学习中最简单的模型,“线性回归”和...因此今天,我们就试着用代码来简单实现一下逻辑回归,也方便大家更好地理解逻辑回归的原理,以及机器学习模型在实践中是怎么运作的。...这里我用的数据集是来自Peter Harrington《机器学习实战》第五章上的数据集,github链接(https://github.com/pbharrin/machinelearninginaction...《机器学习实战》,人民邮电出版社 数据集来源 Github:Peter Harrington(https://github.com/pbharrin/machinelearninginaction) 本章数据集来源...:Ch5 周志华著.机器学习, 清华大学出版社 李航著.统计学习方法, 清华大学出版社

    68250

    Python3入门机器学习(一)- 机器学习基本概念

    数据4 机器学习中监督学习的基本任务 分类任务 将给定的数据进行分类,比如区分猫和狗 二分类任务 判断邮件是垃圾邮件;不是垃圾邮件 判断发放给客户信用卡有风险;没有风险 判断病患良性肿瘤;恶性肿瘤...给机器的训练数据拥有“标记”或者“答案”,人类已经给机器对数据进行了正确答案的划分,这个答案的划分本身就是监督的信息 图像已经拥有了标记信息 银行已经积累了一定的客户信息和他们信息卡的信用情况 医院已经积累了一定的病人信息和他们最终确诊是否患病的情况...市场积累了房屋的基本信息和最终成交的金额 非监督学习机器的训练数据没有任何的“答案”和“标记” 对没有“标记”的数据进行分类-聚类分析 对数据进行降维处理 特征提取:信用卡的信用评级和人的胖瘦无关...异常检测 半监督学习 一部分数据有“标记”或者“答案”,另一部分数据没有 更常见:各种原因产生的标记缺失 增强学习 根据周围环境的情况,采取行动,根据采取行动的结果,学习行动方式 无人驾驶 机器人...增强学习 监督学习和半监督学习是基础

    59440

    Python3机器学习实战学习笔记(七):Logistic回归实战篇之预测病马死亡率

    blog.csdn.net/c406495762/article/details/77851973 转载请注明作者和出处: http://blog.csdn.net/c406495762 机器学习知乎专栏...---- 三 从疝气病症状预测病马的死亡率 1 实战背景 本次实战内容,将使用Logistic回归来预测患疝气病的马的存活问题。...下面给出了一些可选的做法: 使用可用特征的均值来填补缺失值; 使用特殊值来填补缺失值,如-1; 忽略有缺失值的样本; 使用相似样本的均值添补缺失值; 使用另外的机器学习算法预测缺失值。...机器学习的一个重要问题就是如何处理缺失数据。这个问题没有标准答案,取决于实际应用中的需求。现有一些解决方案,每种方案都各有优缺点。...本文出现的所有代码和数据集,均可在我的github上下载,欢迎Follow、Star:https://github.com/Jack-Cherish/Machine-Learning 参考文献: 《机器学习实战

    84720

    Python3机器学习实战学习笔记(一):k-近邻算法(史诗级干货长文)

    运行平台: Windows Python版本: Python3.x IDE: Sublime text3 一 简单k-近邻算法     本文将从k-邻近算法的思想开始讲起,使用python3一步一步编写代码进行实战训练...2.5 测试算法:验证分类器     机器学习算法一个很重要的工作就是评估算法的正确率,通常我们只提供已有数据的90%作为训练样本来训练分类器,而使用其余的10%数据去测试分类器,检测分类器的正确率。...3.2 Sklearn简介     Scikit learn 也简称sklearn,是机器学习领域当中最知名的python模块之一。...sklearn包含了很多机器学习的方式: Classification 分类 Regression 回归 Clustering 非监督分类 Dimensionality reduction 数据降维 Model...Selection 模型选择 Preprocessing 数据与处理     使用sklearn可以很方便地让我们实现一个机器学习算法。

    3.2K90

    Python3机器学习实战学习笔记(九):支持向量机实战篇之再撕非线性SVM

    blog.csdn.net/c406495762/article/details/78158354 转载请注明作者和出处: http://blog.csdn.net/c406495762 机器学习知乎专栏...对于线性不可分,我们使用一个非线性映射,将数据映射到特征空间,在特征空间中使用线性学习器,分类函数变形如下: ?...其中ϕ从输入空间(X)到某个特征空间(F)的映射,这意味着建立非线性学习器分为两步: 首先使用一个非线性映射将数据变换到一个特征空间F; 然后在特征空间使用线性学习器分类。...可以解决小样本情况下的机器学习问题,可以解决高维问题,可以避免神经网络结构选择和局部极小点问题。 SVM是最好的现成的分类器,现成是指不加修改可直接使用。...参考资料: [1] SVM多维空间线性可分的理解:https://www.zhihu.com/question/27210162/answer/44815488 [2] 《机器学习实战》第六章

    77120

    Python3 机器学习简明教程

    Python3 机器学习 简明教程.png 1 机器学习介绍     1.1 什么是机器学习     1.2 机器学习的应用     1.3 机器学习基本流程与工作环节         1.3.1...1.3.2 数据清洗         1.3.3 特征选择         1.3.4 模型选择         1.3.5 训练和测试         1.3.6 模型使用     1.4 机器学习算法一览...2 Python 3 机器学习软件包     2.1 多种机器学习编程语言比较     2.2 开发环境 Anaconda 搭建         2.2.1 Windows         ...12 模型选择和提升     12.1 交叉验证     12.2 网格搜索 13 项目实战     13.1 自然语言处理         13.1.1 自然语言处理简介         ...        13.1.6 词干提取         13.1.7 文本分类         13.1.8 取样操作         13.1.9 词袋         13.1.10 实战案例

    85930

    机器学习实战 | Python机器学习算法应用实践

    ,我们会讲解到基于Python的机器学习算法,应用在结构化数据和非结构化数据(图像)上,希望通过文章内容帮助大家在案例中重温机器学习基础知识,并学习应用机器学习解决问题的基本流程。...文章中会用到下述两个库来实现机器学习算法: Scikit-Learn:最常用的python机器学习算法工具库之一。 Keras:便捷的深度学习神经网络搭建应用工具库。...大家可以查看ShowMeAI的 机器学习专题文章 系统了解特征工程的常见方法。 3.3 多模型应用 下一步可以选择各种候选机器学习算法,并应用在数据集上。...5.小结 这篇简单的机器学习教程文章中,我们调用现有的库来应用对应的机器学习算法,解决了2个简单的场景问题。...图解AI数学基础:从入门到精通系列教程 图解大数据技术:从入门到精通系列教程 图解机器学习算法:从入门到精通系列教程 机器学习实战:手把手教你玩转机器学习系列

    1.5K42

    Python3机器学习实战学习笔记(三):决策树实战篇之为自己配个隐形眼镜

    DecisionTreeClassifier构建决策树 使用Graphviz可视化决策树 1 安装Pydotplus 2 安装Graphviz 3 编写代码 七 总结 ---- 一 前言 上篇文章,Python3...《机器学习实战学习笔记(二):决策树基础篇之让我们从相亲说起讲述了机器学习决策树的原理,以及如何选择最优特征作为分类特征。...可以使用已经写好的Python程序构建决策树,不过出于继续学习的目的,本文使用Sklearn实现。...本次实战内容使用的是DecisionTreeClassifier和export_graphviz,前者用于决策树构建,后者用于决策树可视化。...本来是想继续讨论决策树的过拟合问题,但是看到《机器学习实战》将此部分内容放到了第九章,那我也放在后面好了。 ---- 七 总结 决策树的一些优点: 易于理解和解释,决策树可以可视化。

    94530

    机器学习实战 | 机器学习特征工程最全解读

    ,ShowMeAI在前序机器学习实战文章 Python机器学习算法应用实践中和大家讲到了整个建模流程非常重要的一步,是对于数据的预处理和特征工程,它很大程度决定了最后建模效果的好坏,在本篇内容汇总,我们给大家展开对数据预处理和特征工程的实战应用细节做一个全面的解读...特征工程 首先我们来了解一下「特征工程」,事实上大家在ShowMeAI的实战系列文章 Python机器学习综合项目-电商销量预估 和 Python机器学习综合项目-电商销量预估 中已经看到了我们做了特征工程的处理...原理:在训练机器学习模型之后计算置换重要性。这种方法在向模型提出假设,如果在保留目标和所有其他列的同时随机打乱一列验证集特征数据,对预测机器学习模型的准确性的影响程度。...,和业务及数据分布强相关,因此建议在此步骤之前做EDA探索性数据分析来充分理解数据(可以参考ShowMeAI文章 Python机器学习综合项目-电商销量预估 和 Python机器学习综合项目-电商销量预估...参考资料 图解机器学习算法 | 从入门到精通系列 数据分析系列教程 数据科学工具速查 | Pandas使用指南 ShowMeAI系列教程推荐 机器学习实战:手把手教你玩转机器学习系列

    1.8K62

    Python3机器学习实战学习笔记(六):Logistic回归基础篇之梯度上升算法

    blog.csdn.net/c406495762/article/details/77723333 转载请注明作者和出处: http://blog.csdn.net/c406495762 **机器学习知乎专栏...本文可能会略显枯燥,理论居多,Sklearn实战内容会放在下一篇文章。自己慢慢推导完公式,还是蛮开心的一件事。...---- 三 Python3实战 1 数据准备 数据集已经为大家准备好,下载地址:https://github.com/Jack-Cherish/Machine-Learning/blob/master...本文出现的所有代码和数据集,均可在我的github上下载,欢迎Follow、Star:https://github.com/Jack-Cherish/Machine-Learning 参考文献: 斯坦福大学的吴恩达《机器学习...》:https://www.coursera.org/learn/machine-learning 《机器学习实战》第五章内容

    70610
    领券