专栏首页生信小驿站监督式和非监督式机器学习算法

监督式和非监督式机器学习算法

监督式机器学习

实际应用中的机器学习在大部分情况下我们都会使用监督式学习。

监督式学习指的是你拥有一个输入变量和一个输出变量,使用某种算法去学习从输入到输出的映射函数

这种学习方式就称之为监督式学习,因为算法学习从训练数据集学习的过程可以被看成类似于一名教师在监督学习学习的过程。我们已经知道了正确的答案,而算法不断迭代来对训练数据做出预测同时不断被一名教师修正。当算法达到一个可接受程度的表现时学习过程停止。

监督式学习问题可以进一步被分为回归和分类问题

  • 分类:分类问题指的是当输出变量属于一个范畴,比如“红色”和“蓝色”或者“生病”和“未生病”。
  • 回归:回归问题指的是输出变量是一个实值,比如“价格”和“重量”

还有一些种类的问题建立在分类和回归之上,包括推荐问题和时序预测

一些流形的监督式机器学习算法的例子:

回归问题中的线性回归 分类和回归问题中的随机森林 分类问题中的支持向量机

非监督式机器学习

非监督式学习指的是我们只拥有输入变量但是没有相关的输出变量。

非监督式学习的目标是对数据中潜在的结构和分布建模,以便对数据作更进一步的学习。

这种学习方式就称为非监督式学习,因为其和监督式学习不同,对于学习并没有确切的答案和学习过程也没有教师监督。算法独自运行以发现和表达数据中的有意思的结构。

非监督式学习问题可以进一步分为聚类问题和关联问题

  • 聚类问题:聚类学习问题指的是我们想在数据中发现内在的分组,比如以购买行为对顾客进行分组。
  • 关联问题:关联问题学习问题指的是我们想发现数据的各部分之间的联系和规则,例如购买X物品的顾客也喜欢购买Y物品。

一些流形的非监督式学习算法的例子:

  • 聚类问题的k-means算法
  • 关联规则学习问题中的Apriori算法

半监督式机器学习

当我们拥有大部分的输入数据但是只有少部分的数据拥有标签,这种情形称为半监督式学习问题

半监督式学习问题介于监督式和非监督式学习之间。这里有一个好例子如:照片分类,但是只有部分照片带有标签(如,狗、猫和人),但是大部分照片都没有标签。

许多现实中的机器学习问题都可以归纳为这一类。因为对数据打标签需要专业领域的知识,这是费时费力的。相反无标签的数据和收集和存储起来都是方便和便宜的。

我们可以使用非监督式学习的技术来发现和学习输入变量的结构。

我们也可以使用监督式学习技术对无标签的数据进行标签的预测,把这些数据传递给监督式学习算法作为训练数据,然后使用这个模型在新的数据上进行预测。

总结

从本文你可以了解到监督式,非监督式和半监督式学习的不同之处。你现在直到如下:

  • 监督式学习:所有的数据都有标签并且算法从输入数据学习如何预测输
  • 非监督式学习:所有的数据都是无标签的并且算法从输入数据中学习数据固有的结构
  • 半监督式学习:部分数据是有标签的,但大部分没有标签,是一种监督式和非监督式学习的手段都可以使用的学习方法。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Python数据处理从零开始----第二章(pandas)⑧pandas读写csv文件(3)

    如果我们有来自许多来源的数据,如果要同时分析来自不同CSV文件的数据,我们可能希望将它们全部加载到一个数据帧中。在接下来的示例中,我们将使用Pandas rea...

    用户1359560
  • gbm算法

    gbm是通用梯度回归模型(Generalized Boosted Regression Models)简称。GBDT(Gradient Boosting Dec...

    用户1359560
  • python日常技巧(2)将pdf文件中的表格转化成csv文件

    从 PDF 表格中提取表格数据时比较困难的。不久前,一位开发者提供了一个名为 Camelot 的工具,满足大家从 PDF 文件中提取表格数据。

    用户1359560
  • 机器学习(一)——机器学习概述

    机器学习(一)——机器学习概述 (原创内容,转载请注明来源,谢谢) 前言:近期开始学习机器学习,当前视频和书籍一起看,视频看的是吴恩达的机器学习系列课程,...

    用户1327360
  • 简单易懂的讲解深度学习(入门系列之四)

    在前一个小节中,简单地谈了谈什么是“M-P神经元模型”,顺便用生活中生动的小案例,把激活函数和卷积函数的概念撸了一遍。下笔之处,尽显“神经”。当然这里所谓的“神...

    计算机视觉研究院
  • 1吴恩达Meachine-Learing之监督学习和非监督学习

    双愚
  • 机器学习套路就这三个

    想要成为合格的,或者更进一步成为优秀的人工智能工程师或数据科学家,机器学习的各种基础知识是必不可少的。然而,机器学习领域浩如烟海,各类教材和入门课程层出不穷。特...

    刘盼
  • 学习笔记:神经网络学习算法

    有监督学习也称为有导师学习,其特点是需要依赖教师信号进行权值调整,如下图所示。学习时,需要提供训练集。训练集由输入(也称为特征)和输出(也称为目标)构成,也就是...

    Lauren的FPGA
  • “机器学习”三重门,“中庸之道”趋若人

    博士毕业于电子科技大学,美国西北大学访问学者,现执教于河南工业大学。中国计算机协会(CCF)会员,CCF YOCSEF郑州2018—2019年度副主席,ACM/...

    用户1682855
  • 安静的半监督学习革命,一起清理未标记的数据

    对于机器学习工程师来说,访问大量数据十分重要,但有标记的数据很有限。处于此困境的人可能会查阅文献,思考下一步该做什么,而文献似乎都会给出一个现成的答案:半监督学...

    AiTechYun

扫码关注云+社区

领取腾讯云代金券