《机器学习》学习笔记1——绪论 机器学习概述

在亚马逊上买了Peter Flach教授写的段菲博士翻译的《机器学习》一书,开始机器学习之旅。开始之前,先介绍下Peter Flach教授:

布里斯托尔大学人工智能教授,拥有20多年的机器学习教研经验。在高度结构化的数据挖掘以及通过ROC分析来评估和改进机器学习模型方面,Flach是国际领先的研究人员。他还是Machine Learning期刊总编。曾担任2009年ACM知识发现与数据挖掘国际会议、2012年欧洲机器学习与数据挖掘国际会议的程序委员会共同主席。另著有Simply Logical:Intelligent Reasoning by Example

这是他的个人主页Peter Flach

绪论为机器学习概述,正文开始:

1、开篇用一个垃圾邮件过滤器作为引子——SpamAssassin,介绍了如何根据阈值判定是否属于垃圾邮件。书中背景知识1中提到用数学语言描述SpamAssassin的工作原理,将原本的决策规则

向量化表示为

2、机器学习的一般定义:机器学习是对依据经验提升自身性能或丰富自身知识的各种算法和系统的系统性研究。

3、在训练数据上取得优异性能只是手段,而非目的。如果一味追求训练阶段的性能,很容易导致另一个问题——过拟合(overfitting)。通俗地讲,假如你两周后就要考模式识别这门课,你向老师要了前几届的试卷来练(si)习(ji)练(ying)习(bei),由于你上课根本没听过,也没有那个时间来重新看一遍预习加复习,所以你知得死记硬背。当然,几张卷子你很快便得了满分,可以说你的训练阶段性能很好。BUT,考试的时候你就蒙逼了,老师稍微一变你就不会了,这就说明你测试阶段性能很差,这就是所谓的过拟合问题。还有另外一个词可以说就是你的推广性 OR 泛化能力(generalization)很差。

4、任务、模型和特征是机器学习的三大“原料”。

书中提到任务和学习问题是不同的两个概念,需要加以区分:

任务是通过模型来完成的,而学习问题则通过能够产生模型的学习算法来解决。

上图中也可以看出任务与学习问题是不同的,任务不包括训练阶段,BUT学习问题包括。我个人认为,解决学习问题是完成任务的前提,解决学习问题得到模型,然后用模型来完成任务。

5、机器学习所关注的问题是使用正确的特征来构建正确的模型以完成既定的任务。(Machine learning is concerned with using the right features to build the right models that achieve the right tasks.)这段话是作者Important points to remember中的一句话,以后还是得谨记心中并多多体会。

OK,Good Bye Alan!

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏深度学习与数据挖掘实战

前沿|如何把Deep Learning思想应用到Graph Theory?

2001到2010年间,因为Social Networks的兴起,曾经有一段时间有很多学者热衷于研究Graph Theory,以及Graph Theory在Se...

1061
来自专栏大数据文摘

非得从零开始学习?扒一扒强化学习的致命缺陷

Deepmind在Alphago上的成就把强化学习这一方法带入了人工智能的主流学习领域,【从零开始学习】也似乎成为了抛弃人类先验经验、获取新的技能并在各类游戏击...

820
来自专栏量子位

简单易懂解释机器学习:以在线赌博和游戏公司为例

编译 | 量子位 若朴 赌徒往往依赖直觉,庄家偏爱铁一般的事实。他们的最终结局,殊途同归于预测。对于在线赌博和游戏公司而言,他们可以藉由用户鼠标的每次点击获得大...

3928
来自专栏专知

OpenAI 首次突破,AI 在 Dota 2 五对五团战中打败人类

2017 年,OpenAI 在 Dota2 TI 决赛现场以 1 对 1 solo 的方式击败了「Dota2」世界顶级玩家。经过一年的发展,由马斯克和 Sam ...

1364
来自专栏专知

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【导读】亚马逊人工智能部门机器学习专家AlexanderZai最新撰写的深度强化学习实战书籍(预计2018年秋季出版)《Deep Reinforcement L...

1732
来自专栏新智元

AI 派系争斗如火如荼:概率编程技术能彻底取代神经网络吗?

【新智元导读】Gamalon的CEO和创始人Ben Vigoda近日放出豪言,说他和他的团队所采用的概率编程的技术, 终将在所有的应用中彻底取代神经网络——这有...

3749
来自专栏量子位

开源啦:连DeepMind也捉急的游戏,OpenAI给你攻破第一关的高分算法

于是,团队推出了一种方法,叫做“随机网络蒸馏 (Random Network Distillation, RND) ”,专注培养AI的好奇心:隐藏房间什么的,只...

865
来自专栏量子位

谷歌传奇Jeff Dean给创业者的一小时AI讲座 | 86页PPT+视频

李林 若朴 编译整理 量子位 出品 | 公众号 QbitAI ? 少年,你知道Jeff Dean么? 传奇一般的Jeff Dean现在领导着Google Bra...

3343
来自专栏专知

【深度】为什么Alphago Zero是深度学习领域的一次巨大突破?

【导读】Google DeepMind在Nature上发表最新论文,介绍了迄今最强最新的版本AlphaGo Zero,不使用人类先验知识,使用纯强化学习,将价值...

3135
来自专栏机器之心

学界 | 使用深度学习和树搜索进行从零开始的既快又慢的学习

2755

扫码关注云+社区