Machine Learning学习——定义、监督学习和无监督学习

Machine Learning definition

1.Arther Samuel(1959):Machine Learning:Field fo study that gives computers the ability to learn without being explicitly programmed.

2.Tom Mitchell(1998) well-posed Learning Problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its improves with experience E.

Part One

监督学习:

利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练,该过程中有指导者。对于给出的数据集中的每个样本有相应的“正确答案”。

根据这些样本做出预测,分为两大类:回归和分类

根据吴恩达教授的机器学习课程:

(1)回归问题:预测出一个连续值的输出。

例子:预测房价问题,根据样本的数据集进行拟合就可以得到一条连续的曲线。

(2)分类问题:设法预测一个离散值的输出。

例子:根据肿瘤的某些特征来判断是良性还是恶性,得到的结果是“良性”或者是“恶性”,是离散的。

此时的1表示恶性,0表示良性。

根据区域不同的来判断是恶性还是良性。叉表示恶性,圈表示良性。

当然了,预测的特征也是有很多

无监督学习

无监督学习的数据集和监督学习的不同,没任何标签,也就是没有“正确的输出结果”。在此过程中没有指导者,只有计算机自己学习。从数据集中可以通过非监督学习得到数据的某种结构,可能是把数据分成两个不同的聚集簇,称为聚类算法。

聚类算法被应用于很多地方:

(1)Google新闻

(2)基因学的应用:

应用实例

DNA微阵列数据

(3)大型计算机集群、社交网络分析、市场细分问题以及天文数据分析

应用领域

(4)鸡尾酒会问题

宴会中,场景会嘈杂问题等,声音的辨别、过滤以及提取人的声音就会显得很重要。但是需要分析和解析数据问题,所以就涉及无监督学习问题。

鸡尾酒会问题

在使用语言的编程问题上,例如C++或者是Java中,处理音频的问题,需要写很多的代码,还需要连接那些复杂的C++或者Java库,但是在机器学习问题中,我们只需要一行代码即可实现:

代码实现

SVD()函数——奇异值分解的缩写,作为线性代数常规函数的缩写。

参考部分:

吴恩达-机器学习

《机器学习导论 第2版》Ethem Alpaydin

以上内容属于个人学习笔记以及书籍阅读之后增加的理解。如有不妥的内容,请大家指出,谢谢。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏个人分享

数据挖掘10大算法详细介绍

在一份调查问卷中,三个独立专家小组投票选出的十大最有影响力的数据挖掘算法,今天我打算用简单的语言来解释一下。

2904
来自专栏大数据文摘

AI角 | AI challenger零样本学习算法大赛报名开启,数据集开放

1612
来自专栏专知

【MLA首日报告摘要】周志华、马毅等教授分享机器学习最新进展

【导读】第15届中国机器学习及其应用研讨会今天11月4日在北京交通大学举行,海内外从事机器学习及相关领域研究的10余位专家与会进行学术交流,包括特邀报告、顶会论...

3755
来自专栏量化投资与机器学习

【全网首发】机器学习该如何应用到量化投资系列(三)

有一些单纯搞计算机、数学或者物理的人会问,究竟怎么样应用 ML 在量化投资。他们能做些什么自己擅长的工作。虽然在很多平台或者自媒体有谈及有关的问题,但是不够全面...

5349
来自专栏美图数据技术团队

科普 | 贝叶斯概率模型一览

机器学习狭义上是指代统计机器学习,如图 1 所示,统计学习根据任务类型可以分为监督学习、半监督学习、无监督学习、增强学习等。

1574
来自专栏专知

基于信息理论的机器学习-中科院自动化所胡包钢研究员教程分享02(附pdf下载)

【导读】上一次专知推出基于信息理论的机器学习报告,大家反响热烈,今天是胡老师提供的第二部分(为第三章内容)进行详细地注释说明,请大家查看! ▌概述 ---- 本...

3489
来自专栏AI星球

[转载]深度学习技术在文本数据智能处理中的实践

人工智能目前的三个主要细分领域为图像、语音和文本,老师分享的是达观数据所专注的文本智能处理领域。文本智能处理,亦即自然语言处理,试图让机器来理解人类的语言,而语...

1512
来自专栏达观数据

这个男人嫁还是不嫁?懂点朴素贝叶斯(Naive Bayes)原理让你更幸福

1652
来自专栏Petrichor的专栏

深度学习: CV顶会 & CV顶刊

[1] 计算机视觉顶尖期刊和会议有哪些 [2] cvpr中poster,oral,spotlight的区别是什么 [3] AI学术会议Deadline清...

3793
来自专栏AI研习社

2017 知乎看山杯从入门到第二

利用一个暑假的时间,做了研究生生涯中的第一个正式比赛,最终排名第二,有些小遗憾,但收获更多的是成长和经验。我们之前没有参加过机器学习和文本相关的比赛,只是学过一...

2987

扫码关注云+社区

领取腾讯云代金券