[机器学习Lesson 1 Introduction] 机器学习的动机与应用

1. Machine Learning definition(机器学习定义)

  • Arthur Samuel(1959年)将机器学习非正式定义为:在不直接针对问题进行编程的情况下,赋予计算机学习能力的一个研究领域。 创造西洋棋程序,可以和自己对战。
  • Tom Mitchell(1998年)提出一个更为正式关于机器学习的定义 :对于一个计算机程序来说:给它一个任务T和一个性能测量方法P,如果在经验E的影响下,P对T的测量结果得到了改进,那么就说改程序从E中学习。

E = the experience of playing many games of checkers

T = the task of playing checkers.

P = the probability that the program will win the next game.

2. Supervised Learning (监督学习)

它被称作监督学习是因为对于每个数据来说 我们给出了 “正确的答案”。

你有一些问题和他们的答案,你要做的有监督学习就是学习这些已经知道答案的问题。然后你就具备了经验了,这就是学习的成果。然后在你接受到一个新的不知道答案的问题的时候,你可以根据学习得到的经验,得出这个新问题的答案。(试想一下高考不正是这样,好的学习器就能有更强的做题能力,考好的分数,上好的大学.....)。我们有一个样本数据集,如果对于每一个单一的数据根据它的特征向量我们要去判断它的标签(算法的输出值),那么就是有监督学习。通俗的说,有监督学习就是比无监督学习多了一个可以表达这个数据特质的标签。

包含回归(Regression)和分类(Classfication)。

  • 举例:
    1. 房价 与 面积的关系

2.1 Classfication (分类任务)

++离散++变量预测,设定了标准答案,复合条件,是或否。

image
  • 举例:
    1. 肿瘤良性/恶性 与 肿瘤大小的关系。(0或1结构)
    2. 年纪 与 肿瘤大小关系。(聚合结构)
    3. 预测明天的气温是多少度
  • Support Vector machines(支持向量机的算法):可以吧数据映射到无限维空间中。
  • 问题:
    1. 如何把一个无限维的向量映射到计算机内存中?
    2. 如何表示一个无限纬空间中的点?

2.2 Regression(回归任务)

++连续++变量预测。

image
  • 举例:
    1. 预测明天的气温是多少度。

3. Unsupervised Learning(无监督学习)

数据聚合、分类。

image

我们有一些问题,但是不知道答案,我们要做的无监督学习就是按照他们的性质把他们自动地分成很多组,每组的问题是具有类似性质的(比如数学问题会聚集在一组,英语问题会聚集在一组,物理........)。

所有数据只有特征向量没有标签,但是可以发现这些数据呈现出聚群的结构,本质是一个相似的类型的会聚集在一起。把这些没有标签的数据分成一个一个组合,就是聚类(Clustering)。比如Google新闻,每天会搜集大量的新闻,然后把它们全部聚类,就会自动分成几十个不同的组(比如娱乐,科技,政治......),每个组内新闻都具有相似的内容结构。

  • 举例:
    1. 提供一组数据,不提供任何数据的正确答案,你能否在这组数据中寻找到一些有趣的数据结构?
    2. 基因数据分组。
    3. 聚合算法处理图像,对像素数据进行聚合分组,得到类似素描的效果,等效表达。
    4. 图像处理,将图像分成不同区域,像素分到不同区域。创建3D模型,创造类似AR的效果。
    5. 计算机集群,社交网络分析,市场划分,航天数据分析。

3.1 Cocktail party problem(鸡尾酒会问题)

假设我们在参加一个鸡尾酒会,有很多人参加,在环境嘈杂,很多人说话的情况下,能否把感兴趣的某个人的声音单独从嘈杂的背景音中提取出来?

规律:不同麦克风收集到说话者声音大小不一样。

  • 算法A 将人声从人声中分离
  • 独立组件分析 将人声从音乐中分离

其他应用:

  • 文本处理
  • 理解功能分级

使用MATLAB一行代码实现以上算法。

3.2 ICA algorithm

[W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');

4. Reinforcement Learning(强化算法学习)

基本概念是一个被称为 回报函数的概念。

使用在不需要进行一次决策的情形中。

  • 举例
    1. 使用监督学习进行癌症预测,预测一个病人肿瘤是否为恶性。你的预测决定了病人是生死。通过决策产生一个结论,要么对,要么错。

在强化学习问题中,通常会一段时间内做出一系列的决策

  • 举例
    1. 自动直升机:给你自动直升机的钥匙,能否写个程序让它飞起来?如果做了一个坏的决策,飞机可能不会马上摔下来,只有你连续做出很多坏的决策时,飞机才会摔下来。相反的,只要连续的做出正确的决策,飞机就可以飞起来了。
    2. 训狗,正确奖励;错误惩罚。
    3. 机器人领域。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技大本营的专栏

重磅 | 苹果发布最新论文: 揭秘Siri新声音背后的技术(文末福利)

翻译 | AI科技大本营(rgznai100) 2011 年 10 月,在 iPhone 4S 的发布会,Siri 作为首款语音助手,惊艳亮相,然而 6 年过后...

3048
来自专栏新智元

ICLR oral:清华提出离散化架构WAGE,神经网络训练推理合二为一

1894
来自专栏大数据文摘

资源 | 一文解析统计学在机器学习中的重要性(附学习包)

你可以使用描述性统计方法将原始观测数据转换为你可以理解和共享的信息,也可以使用推断统计方法,通过数据的小样本对整个域进行推理。

960
来自专栏计算机视觉战队

未来人工智能之人脸领域技术

部分来源于《机器人大讲堂》和《2017年中国人脸识别未来发展路径、市场需求、市场发展空间预测》 ? 近年来由于深度学习爆炸式的发展,已经带动了整个行业的发展。...

3305
来自专栏奇点大数据

破解PRISMA(下)

经过了两周的各种尝试,在各种及其惨烈的测试结果之后,我们还是在网上找到了相关的Paper作为工作指导。 前两周我们的各种尝试是基于一篇名为《Image Styl...

3647
来自专栏大数据挖掘DT机器学习

数学之美番外篇:平凡而又神奇的贝叶斯方法

作者:LeftNotEasy 原文:http://blog.csdn.net/mydear_11000/article/details/48731497 概率论...

2724
来自专栏新智元

【干货】机器学习工程师必须知道的十个算法

【新智元导读】机器学习算法可以分为三个大类:监督学习、无监督学习、强化学习。监督学习对于有属性(标记)的特定数据集(训练集)是非常有效的。无监督学习对于在给定未...

3116
来自专栏新智元

【CNN已老,GNN来了】DeepMind、谷歌大脑、MIT等27位作者重磅论文,图网络让深度学习也能因果推理

3532
来自专栏数据魔术师

机器学习与运筹学竟如此暧昧??

8875
来自专栏量子位

AI学会了视觉推理,“脑补”看不清的物体 | 李佳李飞飞等的CVPR论文

这张照片在人类眼中,左下角的一小片棕黄黑灰就是一匹活生生的马——这个姿势和场景,当然是骑马啦!

1524

扫码关注云+社区

领取腾讯云代金券