专栏首页专知【重温经典】吴恩达课程学习笔记一:监督学习

【重温经典】吴恩达课程学习笔记一:监督学习

【导读】前一段时间,专知内容组推出了春节充电系列:李宏毅2017机器学习课程学习笔记,反响热烈,由此可见,大家对人工智能、机器学习的系列课程非常感兴趣,近期,专知内容组推出吴恩达老师的机器学习课程笔记系列,重温机器学习经典课程,希望大家会喜欢。

吴恩达机器学习课程系列视频链接

http://study.163.com/course/courseMain.htm?courseId=1004570029

春节充电系列:李宏毅2017机器学习课程学习全部笔记

吴恩达课程学习笔记一:监督学习

监督学习


课程流程:

1、 举例引出监督学习

2、 给出关于regression(回归)以及classification(分类)的对比

3、 回顾课程内容,并给出一个小题目

1、举例:


房价预测:给定一个房子的尺寸,预测其售价(如下是一个示意图,它是根据已有的数据绘制的)

对于上述的图,我们可以利用一次或者二次函数去拟合price和size之间的关系。例如你有一个朋友拥有750size的房子,用两种方法拟合得出的price大约是150和200(这里是简单的在图上画两条函数线,然后找到750大约对应的price),这两种拟合的结果显然不同,后者预测的price高一些,但这两种拟合之一是否是最合适的拟合方法呢?预测的准确度又如何呢?

上面的例子就是监督学习的一个例子,什么是监督学习(supervised learning)?

监督学习:给算法一个数据集,数据集包含了正确的答案,如上的例子,在收集的数据集中,房子的size会对应着给定的price(这里的price就是正确的答案)。最终要实现的目的是对给定的数据进行预测,比如你为你朋友的房子做价格的预估。

2、Regression和Classification


对于上面提到的例子,它也是一个regression的例子,因为我们默认给定一个输入的值,输出的值是连续的值中的某一个(即房价某种意义上可以看做是连续的)

对于classification,给出下面这个例子:

对于肿瘤的预测问题:横轴是肿瘤大小,纵轴表示是否是恶性肿瘤(即纵轴是两个离散值,1表示是恶性肿瘤,0表示良性):

对于图的上半部分,画出了肿瘤大小与的肿瘤是否为恶性之间的关系,图的下半部分道理一样,只不过只有横轴,把肿瘤的良恶用圆圈和叉表示。

在上面的图中可以看出只利用一个特征去与肿瘤的良恶情况挂钩,当然我们可以有更多的特征,如把检测病人的年龄也作为一个特征,则采用圆圈和叉的方式更能直观的体现出两个特征与肿瘤良恶之间的关系(叉表示恶性),图如下:

我们把数据交给算法,对于上图,它可能做得是用一条直线来将恶性与良性区分开,如果有某一个人的年龄以及肿瘤大小位于图中的粉红色点位置,那么算法可能会给出结果说他是良性的。

例子中只给出了两种特征,但实际可以有更多,在处理实际问题中,给出的特征问往往不止两种(本题就可以增加例如肿瘤的厚度,肿瘤细胞大小的均匀性,肿瘤细胞形状的均匀性等特征)。其实我们可以设计算法去处理无穷多的特征。

以上讨论的是分类的一个例子,对于回归与分类,总结如下:

Regression解决的是预测连续值输出的问题,classification解决的是预测离散值输出的问题。

3、a small quiz


对于上图给定的两个预测问题,你会采用哪种学习算法呢?

问题一:你有同一件商品许多,你要预测接下来三个月的销售情况

问题二:你这里有许多客户的账户信息,你需要设计一种方法去检测客户的账号信息是否被入侵。

答案选择第三个

参考链接:

http://study.163.com/course/courseMain.htm?courseId=1004570029

本文分享自微信公众号 - 专知(Quan_Zhuanzhi),作者:Fan

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-03-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【新加坡国立大学张戎】深度学习与强化学习(附slide下载)

    来源: https://cloud.tencent.com/developer/article/1006637 随着 DeepMind 公司的崛起,深度学习和强...

    WZEARW
  • Richard S. Sutton经典图书:《强化学习导论》第二版(附PDF下载)

    【导读】Richard S. Sutton就职于iCORE大学计算机科学系,是强化学习领域的专家,其在强化学习领域的著作“Reinforcement Learn...

    WZEARW
  • 脉冲神经网络,下一代机器学习?

    【导读】近日,Devin Soni撰写了一篇博文,讲解了第三代神经网络的构思,脉冲神经网络(Spiking Neural Networks, SNN),目的是在...

    WZEARW
  • 自动驾驶迎来发展新机遇!智能网联汽车将成为产业重要突破口

    智能网联汽车已成筹划重中之重 从“行动筹划”的内容看,我国人工智能财产应着重在以下范畴率先取得打破,第一项即为智能网联汽车,支持车辆智能计算平台系统架构、车载智...

    企鹅号小编
  • 强化学习开源项目:自己动手创建虚拟自动驾驶汽车

    想象一下,你生活在一个没有交通拥堵,没有交通事故,也无需花费时间开车的世界,那会多美好。

    AiTechYun
  • ICLR 2019评审结果出炉!优质论文抢先看!

    至于录取率,目前还没有官方公布。从ICLR 2018的情况来看,平均分达到6.57可以被接收,Top 33%的论文可以被接收为poster或talk。但今年的投...

    昱良
  • 黑客称钱已经赚够了,大方放出3.86亿条用户数据供免费索取

    “BleepingComputer 已经联系了 ShinyHunters 提供免费服务的每一家公司,但没有收到任何一家公司的回复。这种缺乏回应的情况在报告数据泄...

    数据猿
  • 肿瘤微环境:Tumor microenvironment (TME)简介

    肿瘤细胞与其所处的微环境是一个功能整体,肿瘤细胞看做是种子,而肿瘤细胞所处的微环境看做是土壤,肿瘤细胞与其微环境相互影响,共同进化,促进了肿瘤的产生。

    生信修炼手册
  • OpenLDAP管理工具之LDAP Admin

    在CDH集群中集成了OpenLDAP后,在向LDAP中添加一个用户需要通过编辑ldif文件,对于一些不熟悉的新手来说是非常不方便的,在前面的文章《12.Open...

    Fayson
  • 《Greenplum 从大数据战略到实现》总结

    以下是作者对《Greenplum 从大数据战略到实现》的总结,分享给大家。一张长长的黄图,欢迎大家查看。作者只总结了第四章、第五章、第六章、第七章、第八章,第十...

    小徐

扫码关注云+社区

领取腾讯云代金券