《机器学习》学习笔记1——绪论 机器学习概述

在亚马逊上买了Peter Flach教授写的段菲博士翻译的《机器学习》一书,开始机器学习之旅。开始之前,先介绍下Peter Flach教授:

布里斯托尔大学人工智能教授,拥有20多年的机器学习教研经验。在高度结构化的数据挖掘以及通过ROC分析来评估和改进机器学习模型方面,Flach是国际领先的研究人员。他还是Machine Learning期刊总编。曾担任2009年ACM知识发现与数据挖掘国际会议、2012年欧洲机器学习与数据挖掘国际会议的程序委员会共同主席。另著有Simply Logical:Intelligent Reasoning by Example

这是他的个人主页Peter Flach

绪论为机器学习概述,正文开始:

1、开篇用一个垃圾邮件过滤器作为引子——SpamAssassin,介绍了如何根据阈值判定是否属于垃圾邮件。书中背景知识1中提到用数学语言描述SpamAssassin的工作原理,将原本的决策规则

向量化表示为

2、机器学习的一般定义:机器学习是对依据经验提升自身性能或丰富自身知识的各种算法和系统的系统性研究。

3、在训练数据上取得优异性能只是手段,而非目的。如果一味追求训练阶段的性能,很容易导致另一个问题——过拟合(overfitting)。通俗地讲,假如你两周后就要考模式识别这门课,你向老师要了前几届的试卷来练(si)习(ji)练(ying)习(bei),由于你上课根本没听过,也没有那个时间来重新看一遍预习加复习,所以你知得死记硬背。当然,几张卷子你很快便得了满分,可以说你的训练阶段性能很好。BUT,考试的时候你就蒙逼了,老师稍微一变你就不会了,这就说明你测试阶段性能很差,这就是所谓的过拟合问题。还有另外一个词可以说就是你的推广性 OR 泛化能力(generalization)很差。

4、任务、模型和特征是机器学习的三大“原料”。

书中提到任务和学习问题是不同的两个概念,需要加以区分:

任务是通过模型来完成的,而学习问题则通过能够产生模型的学习算法来解决。

上图中也可以看出任务与学习问题是不同的,任务不包括训练阶段,BUT学习问题包括。我个人认为,解决学习问题是完成任务的前提,解决学习问题得到模型,然后用模型来完成任务。

5、机器学习所关注的问题是使用正确的特征来构建正确的模型以完成既定的任务。(Machine learning is concerned with using the right features to build the right models that achieve the right tasks.)这段话是作者Important points to remember中的一句话,以后还是得谨记心中并多多体会。

OK,Good Bye Alan!

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏腾讯云人工智能

【专栏】图像分析那些事︱AI来了

本文简单介绍一下成像和图像分析的基本内容,希望对有兴趣解决图像类问题的同学有所帮助。

7.5K33
来自专栏新智元

【Quora精彩问答】机器学习的十条金科玉律

【新智元导读】曾在 Endeca, Google, LinkedIn 负责机器学习项目的 Daniel Tunkelang 在 Quora 上发表了给非专业人士...

3618
来自专栏数据科学与人工智能

【深度学习】深度学习未来十大趋势

神经网络框架变得越来越复杂而精密 在感知、语言翻译等等方面的大部分最先进的神经网络框架正在发展并且不在仅仅关于简单前馈式(feed forward)框架或者卷积...

2869
来自专栏AI科技评论

五大顶尖研究院的116篇ICLR 2018录用论文,七大趋势全解读

AI 科技评论按:时间过得好快,Yann LeCun 仿佛刚刚在 Twitter 上感慨 ICLR 2018 的参会人数比 2017 年再次翻倍,而现在 ICL...

936
来自专栏xingoo, 一个梦想做发明家的程序员

极大似然估计的理解与应用

极大似然估计是概率论中一个很常用的估计方法,在机器学习中的逻辑回归中就是基于它计算的损失函数,因此还是很有必要复习一下它的相关概念的。 背景 先来看看几个小例...

2654
来自专栏机器之心

三问 Christopher Manning:超越模型存在的语言之美

机器之心原创 作者:邱陆陆 「深度学习的波浪在计算语言学的海岸线上往复经年,而今已如海啸一般向所有的自然语言处理(NLP)会议发起冲击」。两年前,在北京,Chr...

30110
来自专栏目标检测和深度学习

CVPR 2018视频行为识别挑战赛结果出炉:前三名均由国内团队包揽

Moment 是由 MIT-IBM Watson AI Lab 开发的研究项目。该项目致力于构建超大规模数据集来帮助 AI 系统识别和理解视频中的动作和事件。

752
来自专栏机器人网

《机器学习生态全景图》人工智能这五大流派你还傻傻分不清?

AI 的方法有许多,除了我们较为熟悉的“五大流派”,本文作者对 AI 的各流派进行细分,梳理了起码 17 种方法,并用一张图直观地展现。作者说,各种 AI 方法...

36512
来自专栏ATYUN订阅号

2018 CVPR正式开幕,斯坦福大学和加州大学伯克利分校赢得最佳论文奖

2018年计算机视觉和模式识别会议(CVPR)在美国盐湖城开幕。CVPR组委会宣布了最佳论文和最佳学生论文。

864
来自专栏机器之心

专访乔治亚理工终身教授蓝光辉: 开创随机加速梯度法助力深度学习

机器之心原创 作者:李泽南 蓝光辉教授,博士毕业于乔治亚理工学院,目前任教于乔治亚理工 H. Milton Stewart 工业和系统工程学院,他还担任着《Co...

2828

扫码关注云+社区