专栏首页派树AIMachine Learning学习——定义、监督学习和无监督学习
原创

Machine Learning学习——定义、监督学习和无监督学习

Machine Learning definition

1.Arther Samuel(1959):Machine Learning:Field fo study that gives computers the ability to learn without being explicitly programmed.

2.Tom Mitchell(1998) well-posed Learning Problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its improves with experience E.

Part One

监督学习:

利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练,该过程中有指导者。对于给出的数据集中的每个样本有相应的“正确答案”。

根据这些样本做出预测,分为两大类:回归和分类

根据吴恩达教授的机器学习课程:

(1)回归问题:预测出一个连续值的输出。

例子:预测房价问题,根据样本的数据集进行拟合就可以得到一条连续的曲线。

(2)分类问题:设法预测一个离散值的输出。

例子:根据肿瘤的某些特征来判断是良性还是恶性,得到的结果是“良性”或者是“恶性”,是离散的。

此时的1表示恶性,0表示良性。

根据区域不同的来判断是恶性还是良性。叉表示恶性,圈表示良性。

当然了,预测的特征也是有很多

无监督学习

无监督学习的数据集和监督学习的不同,没任何标签,也就是没有“正确的输出结果”。在此过程中没有指导者,只有计算机自己学习。从数据集中可以通过非监督学习得到数据的某种结构,可能是把数据分成两个不同的聚集簇,称为聚类算法。

聚类算法被应用于很多地方:

(1)Google新闻

(2)基因学的应用:

应用实例

DNA微阵列数据

(3)大型计算机集群、社交网络分析、市场细分问题以及天文数据分析

应用领域

(4)鸡尾酒会问题

宴会中,场景会嘈杂问题等,声音的辨别、过滤以及提取人的声音就会显得很重要。但是需要分析和解析数据问题,所以就涉及无监督学习问题。

鸡尾酒会问题

在使用语言的编程问题上,例如C++或者是Java中,处理音频的问题,需要写很多的代码,还需要连接那些复杂的C++或者Java库,但是在机器学习问题中,我们只需要一行代码即可实现:

代码实现

SVD()函数——奇异值分解的缩写,作为线性代数常规函数的缩写。

参考部分:

吴恩达-机器学习

《机器学习导论 第2版》Ethem Alpaydin

以上内容属于个人学习笔记以及书籍阅读之后增加的理解。如有不妥的内容,请大家指出,谢谢。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • machine learning笔记基础——线性代数基础

    对于复合的矩阵运算问题,和普通数字加减乘除是一样的,有括号先算括号,有乘除就算乘除,最后算加减。例如:

    阳光罗诺
  • 机器学习笔记——Logistic回归算法

    logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。

    阳光罗诺
  • Machine Learning笔记——单变量线性回归

    在机器学习中,样本一般分成独立的三部分训练集(train set),验证集(validation set)和测试集(test set)。其中,训练集用于建立模型...

    阳光罗诺
  • Redis 数据持久化?-----意外宕机如何避免数据丢失

    我们在实际应用生产中,大部分公司会把 Redis 当做缓存使用,用它来把后端数据库中的数据存储在内存中,然后直接从内存中直接读取数据,这样会使这个程序响应速度变...

    张琳兮
  • Redis 数据持久化?-----意外宕机如何避免数据丢失

    我们在实际应用生产中,大部分公司会把 Redis 当做缓存使用,用它来把后端数据库中的数据存储在内存中,然后直接从内存中直接读取数据,这样会使这个程序响应速度变...

    张琳兮
  • 今日 Paper | 自适应次梯度法;多域联合语义框架;无问答对分析;口语系统评价等

    论文名称:Adaptive Subgradient Methods for Online Learning and Stochastic Optimizatio...

    AI科技评论
  • 2017年总结与2018年目标和计划

      前段时间看到版内经常会有2017年的总结,但我总觉得年还没过,2017就不算真正的过完,上周五公司开了部门年会,这周五公司要开公司年会,年会完了再过一周多就...

    Charlotte77
  • java初学者怎么学习java路线最效率,不走弯路

    如果我们是零基础或者非计算机专业毕业的,或者是计算机毕业的铜须,那么我们的基础我认为是比较不扎实的,换句话来说就是即使作为实习生来说,工作给我们的小任务我们都无...

    java学长
  • spark Pi && word count计算

    2.随机向正方形内随机找n个点,计算每一个点到圆心的距离,小于1的就是圆内的点,假设数量是count

    用户6404053
  • Deep Learning Book 中文5.7-6.2节 机器学习基础-深度前馈网络

    监督学习算法、无监督学习算法、推动深度学习的挑战;基于梯度的学习:最大似然学习条件分布;不同的输出单元:多分类等。

    用户1908973

扫码关注云+社区

领取腾讯云代金券