专栏首页数说工作室【数说学院】机器学习分类大全

【数说学院】机器学习分类大全

作者 | 冰 · 冰

本文及图的作者是两个人,她们是一个女子博士团体——冰 · 冰

图中整理了机器学习的各种方法,大体分为监督式学习、半监督式学习、无监督式学习、增强学习、其他五大类,每一类都有很多算法实现。点击查看大图,下面的内容是文字版的整理。

编辑 | 数说君

一、监督式学习 Supervised Learning

在监督式学习下,每组训练数据都有一个标识值或结果值,如客户流失对应1,不流失对应0。在建立预测模型的时候,监督式学习建立一个学习过程,将预测的结果与训练数据的实际结果进行比较,不断的调整预测模型,直到模型的预测结果达到一个预期的准确率。

1. 分类 Classification

(1)K最近邻 K-Nearest Neighbor (KNN)

(2)朴素贝叶斯 Naive Bayes

(3)决策树 Decision Tree

◆ C4.5

◆ 分类回归树 Classification And Regression Tree (CART)

(4)支持向量机器 Support Vector Machine (SVM)

2. 回归 Regression

(1)线性回归 linear regression

(2)局部加权回归 Locally weighted regression

(3)逻辑回归 logistic Regression

(4)逐步回归 stepwise regression

(5)多元自适应回归样条法 multivariate adaptive regression splines

(6)局部散点平滑估计 Locally estimated scatter plot smoothing ( LOESS )

(7)岭回归 Ridge Regression

(8)Least Absolute Shrinkage and Selection Operator ( LASSO )

(9)弹性网络 Elastic Net

(10)多项式回归 Polynomial Regression

3. 排序 Rank

(1)单文档分类 Pointwise

◆ McRank

(2)文档对方法(Pairwise)

◆ Ranking SVM

◆ RankNet

◆ Frank

◆ RankBoost

(3)文档列表方法(Listwise)

◆ AdaRank

◆ SoftRank

◆ LambdaMART

4. 匹配学习

(1)人工神经网络

◆ 感知神经网络 Perception Neural Network

◆ 反向传递 Back Propagation

◆ Hopfield网络

◆ 自组织映射 Self-Organizing Map ( SOM )

◆ 学习矢量量化 Learning Vector Quantization ( LVQ )

二、半监督学习

在半监督学习方式下,训练数据有部分被标识,部分没有被标识,这种模型首先需要学习数据的内在结构,以便合理的组织数据来进行预测。算法上,包括一些对常用监督式学习算法的延伸,这些算法首先试图对未标识数据进行建模,在此基础上再对标识的数据进行预测。如深度学习:

1. 深度学习 Deep Learning

深度学习是 监督学习的匹配学习中人工神经网络延伸出来发展出来的。

(1)受限波尔兹曼机 Restricted Boltzmann Machine ( RBM )

(2)深度信念网络 Deep Belief Networks ( DBN )

(3)卷积网络 Convolutional Network

(4)栈式自编码 Stacked Auto-encoders

三、无监督学习 Unsupervised Learning

在非监督式学习中,数据并不被特别标识,学习模型是为了推断出数据的一些内在结构。

1. 聚类 Cluster

(1)K均值 k-means

(2)最大期望算法 Expectation Maximization ( EM )

(3)降维方法 Dimensionality Reduction

◆ 主成分分析Principal Component Analysis ( PCA )

◆ 偏最小二乘回归 Partial Least Squares Regression ( PLS )

◆ Sammon映射 Sammon Mapping

◆ 多维尺度分析 Multidimensional Scaling ( MDS )

◆ 投影寻踪 Projection Pursuit

◆ RD

2. 关联规则 Association Rule

(1)Apriori

(2)Eclat

四、增强学习 Reinforcement Learning

在之前的讨论中,我们总是给定一个样本x,然后给或者不给标识值或结果值(给了就是监督式学习,不给就是无监督式学习)。之后对样本进行拟合、分类、聚类或者降维等操作。然而对于很多序列决策或者控制问题,很难有这么规则的样本。比如,四足机器人的控制问题,刚开始都不知道应该让其动那条腿,在移动过程中,也不知道怎么让机器人自动找到合适的前进方向。

增强学习要解决的是这样的问题:一个能感知环境的自治agent,怎样通过学习选择能达到其目标的最优动作。这个很具有普遍性的问题应用于学习控制移动机器人,在工厂中学习最优操作工序以及学习棋类对弈等。当agent在其环境中做出每个动作时,施教者会提供奖励或惩罚信息,以表示结果状态的正确与否。例如,在训练agent进行棋类对弈时,施教者可在游戏胜利时给出正回报,而在游戏失败时给出负回报,其他时候为零回报。agent的任务就是从这个非直接的,有延迟的回报中学习,以便后续的动作产生最大的累积效应。

1. Q-Learning

2. 时间差学习 Temporal difference learning

五、其他

集成算法

集成算法用一些相对较弱的学习模型独立地就同样的样本进行训练,然后把结果整合起来进行整体预测。

1. Boosting

2. Bootstrapped Aggregation ( Bagging )

3. AdaBoost

4. 堆叠泛化 Stacked Generalization

5. 梯度推进机 Gradient Boosting Machine ( GBM )

6. 随机森林 Random Forest

图中还总结了机器学习的应用领域,在图左上角。目前,机器学习被广泛运用在:

  • 数据挖掘
  • 计算机视觉
  • 自然语言处理
  • 生物特征识别
  • 搜索引擎
  • 医学诊断
  • 信用卡欺诈检测
  • 证券市场分析
  • DNA测序
  • 语音/手写识别
  • 战略游戏
  • 机器人运用

等等领域。

对各种算法感兴趣的,可以关注我们,【数说学院】将会慢慢给大家介绍。

本文分享自微信公众号 - 数说工作室(shushuojun),作者:冰 · 冰

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2015-10-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 用【机器学习】来研究【机器学习】:SVM为最热门研究主题,Python超越SAS和R

    前几天BAT齐聚深圳,机器学习、人工智能成了热门话题。有人问我,机器学习这么逆天,怎么不用来学习学习“自己”(指机器学习本身)呢? 别急,今天介绍两个研究,都是...

    数说君
  • 7个技巧,讲数据故事 | 数说 · 精选

    数据分析师,不仅在于“数据”,更在于“分析”,用数据讲故事的能力非常重要。 英国著名物理学家法拉第,他发现了电磁感应现象,提出电磁学说的基本理论,奠定了现代电...

    数说君
  • 这是一份开光的课程 |《神经网络》中文字幕版(1.5)

    《Neutral Network for Machine Learning》(机器学习中的神经网络)系列课程,是深度学习大神 Geoffrey Hinton 毕...

    数说君
  • [机智的机器在学习]机器学习方法的分类

    今天主要介绍一下机器学习里面的几个基本概念,我刚开始学的时候,比较纠结的几个概念,主要有监督学习,无监督学习,半监督学习, 深度学习, 还有强化学习,强化学习是...

    用户1622570
  • 机器学习 – machine learning | ML

    1956 年提出 AI 概念,短短3年后(1959) Arthur Samuel 就提出了机器学习的概念:

    easyAI
  • 【机器学习基础】机器学习介绍

    机器学习是一个跟“大数据”一样近几年格外火的词汇。而机器学习究竟是一个什么过程或者行为呢?接下来,让我们来看看什么是机器学习。

    用户7459214
  • 视频 | 没有博士学位和顶会论文,我如何拿到DeepMind的offer?

    AI 科技评论按:这里是,油管 Artificial Intelligence Education 专栏,原作者 Siraj Raval 授权雷锋字幕组编译。 ...

    AI科技评论
  • 学习笔记:神经网络学习算法

    有监督学习也称为有导师学习,其特点是需要依赖教师信号进行权值调整,如下图所示。学习时,需要提供训练集。训练集由输入(也称为特征)和输出(也称为目标)构成,也就是...

    Lauren的FPGA
  • 什么是机器学习?有哪些分类?怎样上手开发?终于有人讲明白了

    导读:本文首先介绍何谓机器学习,以及与机器学习相关的基本概念,这是学习和理解机器学习的基础。按照学习方式的不同,机器学习可以分为不同类型,如监督学习、无监督学习...

    华章科技
  • 无监督学习?Yann LeCun说:或许应该叫它预测性学习

    近日,有人提出赋予无监督学习新的名字——预测性学习。推崇这次改名的正是前些日子在推特「大火」的Facebook的首席AI科学家,Yann LeCun。

    新智元

扫码关注云+社区

领取腾讯云代金券