春节充电系列:李宏毅2017机器学习课程学习笔记01之简介

【导读】春节将近,在亲友相聚之余也不忘给自己充充电。为此,专知内容组给大家带来了台大李宏毅老师的2017年机器学习课程系列学习笔记。今天我们先来看一下该系列课程的内容简介。从本质上来讲,机器学习可以分为三部分:函数集(也就是model)、评价函数好坏的标准、训练集。该课程中机器学习的大致内容包括:有监督学习、无监督学习、半监督学习、回归、分类、迁移学习、结构化学习、强化学习。今天我们就来总览一下这些技术,并在后续的更新中跟大家一一介绍。

课件网址:

http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML17_2.html

视频网址:

https://www.bilibili.com/video/av15889450/index_1.html

李宏毅机器学习笔记- Introduction

人工智能目前是非常热门的技术,人工智能在20世纪50年代已经出现,机器学习在20世纪80年代兴起,深度学习最近才火起来,其中人工智能是目标,机器学习是手段,深度学习是机器学习的一部分。

传统的计算机程序可以理解为人类设定好的天生本能,但它永远不会超过创造者

而机器学习则能够从已有的知识中学习到新的知识

其本质是从数据集中学习到一个函数,当你给这个函数一个输入,它就会有一个输出,这个输出就是人类想要的答案。函数f特别复杂,不可能通过人类推算出来,需要机器来学习

机器学习可以简单分为三个部分,第一个是函数集,也称为model,第二个为评价函数好坏的标准,用来选出最好的函数,第三个为训练集,帮助训练想要的函数。

所学习到的函数应该有举一反三的能力,即使训练集中没出现的东西,例如猫的图片,函数也应该给出一个结果。

机器学习的大体框架如下:

Supervised learning中的task和method在其他scenario也同样存在

supervised learning即监督学习,其典型特征为数据集有其标签,例如猫的图片标记着猫,狗的图片标记着狗。

regression即回归,从以往数据中总结经验,输出一个数值,一般用于预测任务,例如pm2.5的预测

Classification


classification即分类,分为binary classification和multi-class classification。Binary classification根据输入判断yes或者no,而multi-class classification相当于选择题,从多个类别选出一个答案

binary classification的典型例子为垃圾邮件的分类

multi-class classification的例子为文档分类

以上Supervised learning需要许多数据,我们可以采用别的方法减少数据量

Semi-supervised learning


半监督学习中,有许多没有label的数据集,这些没有label数据集对训练很有帮助

Transfer learning


迁移学习讲的一堆不相关的有label或者没label的图片,怎么对训练产生作用。例如炮姐(御坂美琴)的图片对于猫和狗的识别系统肯定不相关

Unsupervised learning


无监督学习中的数据集都没有标签,相当于无师自通,只有input,没有output

例如机器可以浏览很多动物图片后然后自己画出一个新的动物图片(当然可能图片很奇怪)

Structured learning

Structured learning典型特点是输出有结构性的东西

Regression classification了解的是这个世界,structured learning学习的是世界外的暗黑大陆,有很多问题人们没有探究

Reinforcement learning

增强学习典型特征是从评价中学习,并不告诉机器怎么做,而是告诉机器这样做的对不对

典型的应用就是alpha go

最后总结一下机器学习大体框架

后台回复“LHY2017” 就可以获取 2017年李宏毅中文机器学习课程下载链接~

-END-

原文发布于微信公众号 - 专知(Quan_Zhuanzhi)

原文发表时间:2018-02-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏CVer

[计算机视觉论文速递] 2018-06-29 人脸专场

这篇文章有4篇论文速递,都是人脸方向,包括人脸识别、人脸表情识别、人脸情绪分类和人脸属性预测。其中一篇是CVPR 2018 workshop。

2824
来自专栏人工智能LeadAI

大数据和机器学习相关概念

01 大数据的定义 大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发...

3627
来自专栏目标检测和深度学习

一门面向所有人的人工智能公开课:MIT 6.S191,深度学习入门

选自Medium 机器之心编译 参与:黄小天、李泽南 对初学者来说,有没有易于上手,使用流行神经网络框架进行教学的深度学习课程?近日,麻省理工学院(MIT)正式...

35813
来自专栏PPV课数据科学社区

机器学习、数据挖掘、人工智能、统计模型这么多概念有何差异?

在各种各样的数据科学论坛上这样一个问题经常被问到——机器学习和统计模型的差别是什么? 这确实是一个难以回答的问题。考虑到机器学习和统计模型解决问题的相似性,两者...

3667
来自专栏目标检测和深度学习

CVPR 2018 | 哈工大提出STRCF:克服遮挡和大幅形变的实时视觉追踪算法

选自arXiv 作者:Feng Li等 机器之心编译 参与:Nurhachu Null、刘晓坤 视觉追踪在多样本的历史追踪结果中学习时,可能遭遇过拟合问题,并在...

3768
来自专栏新智元

以色列神秘AI研究力量:深度学习的四大失败

【新智元导读】深度学习力量强大,但无论是理论研究者还是实际从业者,了解深度学习的局限也是十分重要的。耶路撒冷希伯来大学的一组研究人员,其中有两位任职于 Mobi...

4348
来自专栏机器之心

一门面向所有人的人工智能公开课:MIT 6.S191,深度学习入门

选自Medium 机器之心编译 参与:黄小天、李泽南 对初学者来说,有没有易于上手,使用流行神经网络框架进行教学的深度学习课程?近日,麻省理工学院(MIT)正式...

3239
来自专栏AI科技评论

学界 | François Chollet谈深度学习的局限性和未来(上)

AI 科技评论按:本文来自 Keras 作者 François Chollet,同时也是根据他撰写的《Deeping Learning with Python》...

1043
来自专栏机器之心

学界 | 让莫奈画作变成照片:伯克利图像到图像翻译新研究

选自arXiv.org 机器之心编译 参与:李泽南 UC Berkeley 的研究者们在图像风格转换领域的探索一直引人注目,几个月前的人工智能生成「猫片」:ed...

3677
来自专栏北京马哥教育

最全解析:大数据和机器学习有什么区别

? 作者:YCM1101743158 来源: http://blog.csdn.net/ycm1101743158/article/details/70158...

50512

扫码关注云+社区

领取腾讯云代金券