【重温经典】吴恩达课程学习笔记二:无监督学习(unsupervised learning)

【导读】前一段时间,专知内容组推出了春节充电系列:李宏毅2017机器学习课程学习笔记,反响热烈,由此可见,大家对人工智能、机器学习的系列课程非常感兴趣,近期,专知内容组推出吴恩达老师的机器学习课程笔记系列,重温机器学习经典课程,希望大家会喜欢。

【重温经典】吴恩达课程学习笔记一:监督学习

吴恩达机器学习课程系列视频链接

http://study.163.com/course/courseMain.htm?courseId=1004570029

春节充电系列:李宏毅2017机器学习课程学习全部笔记

吴恩达课程学习笔记二:无监督学习(unsupervised learning)

1、无监督学习与监督学习的区别


对于监督学习来说,输入算法的数据集中给定了一组特征对应的类别(label)(比如是否是恶性肿瘤)。监督学习又包括回归(regression)和分类(classification)。

而对于无监督学习,输入的数据集不包含label,我们只知道我们这里有一个数据集,那么可以判定出它的结构吗。如上右图,算法可能会将它分为两类,左下角和右上角两类。这种算法叫聚类算法。

例如谷歌新闻,它每天去搜集成千上万的新闻,然后聚类出某一类的新闻显示在一起(例如下图就是把,不同的报纸对某起石油泄露事件的报道的链接整合到一起)

2、一种典型的无监督问题(鸡尾酒会的问题)


假设一个鸡尾酒会只有两个人,同时说话,房间里放置了两个麦克风,麦克风与人的相对位置不同,(或许第一个人的声音在麦克风1里要响一点,第二个人在麦克风2里要响一点)如下图:

现在麦克风里记录了两个人用不同的语言从一数到十的声音,现在将这个混合的音频信息交给无监督学习进行处理,从而找出数据的结构。

“鸡尾酒会”算法可能会得出结果:这可能是两种不同的声音混在了一起,并将两种声音分开。事实上,想要分离出两种声音,用Octave一行代码就可以完成对语音的分离工作(这里的Octave代码虽然只有一行但是这却用了很大的精力,这里算是通识介绍,如果是小白读者大可以不用太过在意):

3、无监督学习两种常见用例


无监督学习常用在探索性分析和降维:

无监督学习在探索性分析中非常有用,因为它可以自动识别数据结构。例如,如果分析师试图对消费者进行细分,那么无监督聚类方法将成为他们分析的一个很好的起点。在人们提出数据趋势是不可能或不切实际的情况下,无监督学习可以提供初始见解,然后用于检验个人的假设。

降维指的是使用较少的列或特征来表示数据的方法,可以通过无监督的方法来实现。在表示学习中,我们希望了解各个特征之间的关系,使我们能够使用与我们初始特征相互关联的潜在特征来表示我们的数据。这种稀疏的潜在结构通常比我们开始使用的功能要少得多,因此它可以使进一步的数据处理变得更加密集,并且可以消除冗余功能

4、a small quiz


对于下图给定的题目,哪些需要使用无监督的算法

选项一:给定一个有是否是垃圾邮件label的数据集,训练一个垃圾邮件分类箱

选项二:给定一组从网上搜集的文章,将同一类的文章分类在一起

选项三:给定顾客的信息,将顾客分成不同购买类型的类别

选项四:给定一批被label了是否患糖尿病的病人信息的数据集,训练数据集从而去预测一个新的病人是否患有糖尿病。

答案:选项二和选项三

后面的笔记中会讲到更多的算法,以及这些算法是如何工作的。期待与你重温经典,一起学习!

参考链接:

http://study.163.com/course/courseMain.htm?courseId=1004570029

原文发布于微信公众号 - 专知(Quan_Zhuanzhi)

原文发表时间:2018-03-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

OpenAI新研究:通过非监督学习提升NLP任务表现

今天,OpenAI在其官方博客上发布了一篇题为《用非监督学习来提升语言理解》的文章,介绍了他们最近的一项研究:Improving Language Unders...

11310
来自专栏人工智能头条

何恺明等在图像识别任务上取得重大进展,这次用的是弱监督学习

24740
来自专栏AI科技评论

学界 | 李飞飞协同斯坦福、CMU带来全新成果:从网络嘈杂的视频中进行学习

李飞飞作为人工智能领域鲜有的活跃女性学者,不知道这一次她又带领着团队做出了怎样的贡献呢?赶紧随AI科技评论来看看吧。这项研究是李飞飞团队在今年CVPR上的一项最...

373100
来自专栏机器之心

前沿 | 利用遗传算法优化神经网络:Uber提出深度学习训练新方式

40260
来自专栏新智元

IEEE预发:DeepMind主攻的深度强化学习3大核心算法及7大挑战

【新智元导读】深度强化学习将有助于革新AI领域,它是朝向构建对视觉世界拥有更高级理解的自主系统迈出的一步。本文将涵盖深度强化学习的核心算法,包括深度Q网络、置信...

39680
来自专栏数据科学与人工智能

【陆勤阅读】【推荐】开发者成功使用机器学习的十大诀窍

作者|Alexander Gray 编译|刘帝伟 转自|CSDN 在提供发现埋藏数据深层的模式的能力上,机器学习有着潜在的能力使得应用程序更加的强大并且更能响应...

22780
来自专栏AI科技评论

Uber 论文5连发宣告神经演化新时代,深度强化学习训练胜过 SGD 和策略梯度

AI 科技评论按:一直低调的 Uber AI 研究院近日连发 5 篇论文,介绍了他们在基因算法(genetic algorithm)、突变方法(mutation...

39160
来自专栏数据科学与人工智能

【机器学习】开发者成功使用机器学习的十大诀窍

在提供发现埋藏数据深层的模式的能力上,机器学习有着潜在的能力使得应用程序更加的强大并且更能响应用户的需求。精心调校好的算法能够从巨大的并且互不相同的数据源中提取...

27480
来自专栏大数据文摘

让你上瘾的网易云音乐推荐算法,用Word2vec就可以实现

15940
来自专栏新智元

DeepMind高赞课程:24小时看完深度强化学习最新进展(视频)

今天,DeepMind 官推贴出一则告示,将 DeepMind 研究人员今年在 UCL 教授的深度强化学习课程“Advanced Deep Learning a...

12020

扫码关注云+社区

领取腾讯云代金券