01 The Learning Problem

本系列文章为林軒田老师機器學習基石上课程学习笔记,见详细课件

课程主线

  • When Can Machines Learn? (illustrative + technical)
  • Why Can Machines Learn? (theoretical + illustrative)
  • How Can Machines Learn? (technical + practical)
  • How Can Machines Learn Better? (practical + theoretical)

也就是要依次回答:何时可以用机器学习?为何可以机器学习?怎样机器学习?怎样更好地机器学习?构建一幅大Picture!

机器学习应用场景

首先有机器学习不同侧面的定义:

  • Improving some performance measure with experience computed from data
  • Use data to compute hypothesis

that approximates target

Key Essence of Machine Learning:

  • A pattern exists(比如随机数生成不可学习)
  • We cannot pin it down mathematically(否则直接公式表示)
  • We have data on it

思考机器学习的这三个key essence,界定遇到的问题是否可用机器学习方法解决。

以下是一些典型的应用场景:

  • When human cannot program the system manually, like navigating on Mars
  • When human cannot ‘define the solution’ easily, like speech/visual recognition
  • When needing rapid decisions that humans cannot do, like high-frequency trading
  • When needing to be user-oriented in a massive scale, like consumer-targeted marketing

问题的Formulation

首先明确其中五个元素:

  • 定义input space
  • 定义output space
  • Target function: unknown pattern to be learned
  • Training examples:
  • Hypothesis: skill with hopefully good performance

最终机器学习Formulation为:

利用target function生成的training examples数据,通过learning algorithm从hypothesis set里找出

使其尽可能接近target function

.

从上面可以看出一个假设,就是训练数据集

是从target function来的,为保证学习效果,

需要足够representative。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏专知

【论文推荐】最新5篇行人重识别( Person Re-ID)相关论文—样本生成、超越人类、实践指南、姿态归一化、图像生成

【导读】专知内容组整理了最近五篇行人重识别( Person Re-Identification)相关文章,为大家进行介绍,欢迎查看! 1. Multi-pseu...

4414
来自专栏量化投资与机器学习

【动态时间规整算法】之股指期货交易策略(一)

前言 Dynamic Time Warping(DTW),动态时间规整算法诞生有一定的历史了(日本学者Itakura提出),它出现的目的也比较单纯,是一种衡量两...

3517
来自专栏CVer

【CVPR 2018 行人重识别】相关论文介绍(下)

上次Amusi很荣幸邀请linolzhang大佬分享关于深度学习的行人重识别方向相关论文整理的文章。由于篇幅有限,上次只介绍了部分论文内容和文献,本文将继续介绍...

4403
来自专栏量子位

自然语言处理中的注意力机制是干什么的?

王小新 编译自Quora 量子位 出品 | 公众号 QbitAI 谈神经网络中注意力机制的论文和博客都不少,但很多人还是不知道从哪看起。于是,在国外问答网站Qu...

2833
来自专栏Java与Android技术栈

基于边缘保留滤波实现人脸磨皮的算法

快速边缘保留滤波是通过积分图像实现局部均方差的边缘保留模糊算法,计算简单而且可以做到计算量跟半径无关。 首先局部均方差滤波中计算局部均值的公式如下:

2252
来自专栏漫漫深度学习路

信息熵(entropy)

information entropy 信息熵用来描述信息的不确定性,如果不确定性越高,那么信息熵越大,否则则越低。 自信息(信息量) I(X)称为自信息,I(...

3548
来自专栏CreateAMind

VAE variation inference变分推理 清爽介绍

Introduction to variational autoencoders VAE第二篇 code: https://github.com/oduerr...

2372
来自专栏机器之心

专栏 | 递归卷积神经网络在解析和实体识别中的应用

38613
来自专栏腾讯音视频实验室

带宽节省利器——帧率上采样

目前大多数人都关注点都在超分辨率技术上,为何不Pick一下帧率上采样呢?

7.7K4
来自专栏语言、知识与人工智能

基于语言模型的拼写纠错

本文则针对中文拼写纠错进行一个简要的概述,主要分享基于n-gram语言模型和困惑集来做中文拼写纠错的方法。

2.2K7

扫码关注云+社区

领取腾讯云代金券