最值得收藏的机器学习入门方法,今天统统分享给你

这里是语言风趣,画风搞怪,演技动人的脏辫小哥Jabrils的油管专栏,每周10分钟,原来机器学习也可以这样好玩! 原标题 HOW TO GET STARTED WITH MACHINE LEARNING! 翻译 | 杨惠淳 字幕 | 凡江

视频内容

一说到机器学习,我被问得最多的问题是:给那些开始学习机器学习的人的最好的建议是什么?

其实说句实话,我并不知道怎么回答这个问题。每一个学习者都是独一无二的个体,有自己的学习需求和目的。我所能做的,就是分享一下当初我开始学习机器学习的时候,对我很有用的方法。

我是如何开始接触机器学习的

让时间回到2017年,我看到了SethBling实现机器学习来玩游戏的一个小演示。

Sethbling-Marl/O-Machine Learing for Video Games

这个小机器人有了自主学习的能力,甚至可以一次又一次地玩马里奥游戏,当时我就震惊了。在那之后,我看到了别的使用神经网络的机器人,被用于各种不同的游戏——

Ding Nicolas-A genetic algorithm learns how to fight!

从 Caryhk 传统的机器学习项目

carykh-Neural Networks and Unwanted Pregnancies in Evolv.io!

到星际机器学习项目——

Youtube Uploaded-AI SC2 FirstSteps

有些人还做了关于侃爷 Rap 的 LSTM 项目

Rabboie Barrat-Neural Network Generated Rap, V2

还有Dota2的Open AI

Dota 2 Dendi vs OpenAI(Bot)-1v1-T17

sentdex 制作的 GTA

sentdex-Stream, FPV, and more dada-Python plays GTA P.15

我知道我必须要去学机器学习,这玩意儿简直太酷了。

我安装了TensorFlow,从syntax上下载了些代码,但是完全不知道代码里是怎么一回事,神经网络的确成功地使用大量的数据集,训练了模型,但我对代码所做的每一次修改都会报错,部分是因为 Python的语法我之前完全没接触过,更为重要的是,我完全不知道该怎么写神经网络。

我先是快速Google了一下“怎样写一个神经网络?”,我发现了一个由完全听不同的数学和符号组成的庞然大物,对我而言看上去就像是外星语,那时我感觉到了强烈的挫败感,但我不达目的誓不罢休。就在那时我接触到了Coursera上吴恩达的机器学习课程,我的天,那个课程同样也是外星语,我能够完成前几章课程完全没有问题,但那之后,吴恩达又开始讲外星语了。

我是如何坚持下去的

同志们,如果像我这样开始机器学习旅程,毫无疑问你会碰到一次巨大的词汇冲击。相信我,你大多数的困惑是因为无法理解提及的单词所引起的。当我意识到这个之后,我改变了我学习方法,转而去学习这个庞大的外星语。在我学习的过程中,有很多术语和符号会反复出现:向量,矩阵,激活函数传播,机器学习等等。我在“向量”这个概念上花了一段时间,感谢 unity3D,每当我觉得理解了机器学习中的一些概念,比如矩阵乘法,我都会回到我最喜欢的机器学习资源,去看看它们对于我来说,是不是变得容易理解了。我很惊讶突然之间,我能够稍微更好地理解这门外星语了。

每当有概念毫无头绪让我止步不前,我都会把他们单独拿出来,举个例子,当我遇到sigmoid或者其他的激活函数,我就会列出一堆困扰我的问题,然后一个个单独查找。

说到这,我非常推荐可汗学院.com。这里有所有在你写自己的机器学习算法所要用到的。我在这里列出了一些你需要去学习的很重要的数学课供你参考,对我个人而言,帮助很大。

我个人很喜欢的学习资源:

Activation Functions - https://en.wikipedia.org/wiki/Activation_function Luis Serrano's Neural Network Series (REALLY GOOD) - https://www.youtube.com/watch?v=UNmqTiOnRfg Giant_Neural_Network's Neural Network Series (REALLY GOOD) - https://www.youtube.com/watch?v=ZzWaow1Rvho Macheads101's Neural Network series - https://www.youtube.com/watch?v=OypPjvm4kiA 3Blue1Brown's Neural Network Series - https://www.youtube.com/watch?v=aircAruvnKk Hugo's Neural Network Series - http://www.mooc.ai/course/300 James Mccaffrey Talk (A BIT OUTDATED INFORMATION BUT STILL A FUN ONE)- https://www.youtube.com/watch?v=-zT1Zi_ukSk

一些很重要的数学课

Vectors (explained with Linear Algebra): https://www.khanacademy.org/math/linear-algebra/vectors-and-spaces Vectors (explained with PreCal): https://www.khanacademy.org/math/precalculus/vectors-precalc Matrices: https://www.khanacademy.org/math/precalculus/precalc-matrices Sequences: https://www.khanacademy.org/math/precalculus/seq-induction Derivative Rules: hhttps://www.khanacademy.org/math/ap-calculus-bc/bc-derivative-rules

一些可能会帮助到你的数学课

Algebra Functions: https://www.khanacademy.org/math/algebra/algebra-functions Quadratics: https://www.khanacademy.org/math/algebra/quadratics Irrational: https://www.khanacademy.org/math/algebra/rational-and-irrational-numbers Analyzing Categorical Data: https://www.khanacademy.org/math/statistics-probability/analyzing-categorical-data

我的建议

(1)更好地理解伪代码

我觉得学习如何写机器学习算法最好的方法,就是去更好地理解伪代码。我们要理解如何去计算它们,还有各种不同的能够相互转换的指数。在我的经验里,大多数情况下,伪代码是十分清晰的。但如果不是的话,可能是因为在外星语中出现的太频繁了。

学习怎样将伪代码转换成你最喜欢的编程语言,其实是最重要的事。其实没有一个一码通吃的神经网络,实际上当你从不同的老师那里学习怎样写神经网络的时候,请一定要注意,他们不会总是使用同样数量的输入,隐藏层节点,激活函数,可能连术语都不一样,有些老师可能会把偏置说成另一个词,这就是伪代码如此重要的原因。

(2)前馈神经网络例子

除了之前所说的我能给你最好的建议,就是用一个简单的前馈神经网络例子来开始你的学习,这有一个很好的例子——做一个文字颜色预测器,当你提供给它,红,绿,蓝值作为输入的时候,尝试去训练它作出,在此之上应该使用深色字还是浅色字,让它能够可以被认出来的预测。我觉得这是个很好的有很简单的项目,值得认真研究以此来学习机器学习的基础。

(3)立刻开始着手

建议你从最开始就着手写你的神经网络,我指的是你学习的第一天,就在这个视频结束的时候,立刻打开你的IDE。纸上得来终觉浅,绝知此事要躬行。尽管理论上知道,如何写神经网络很酷,但实际去写一个神经网络是完全不同的。

当你开始去写一个神经网络的时候,你会卡住,然后你就有了第一个需要去找的问题,尝试去解决它,如此往复,直到你成功。我特别希望,从最一开始我就知道这个建议,这可能会减少我大部分学习的时间。

(4)站在巨人的肩膀上

如果你真的想要能够很好地写出机器学习算法,你需要依靠他人的研究和代码,因为事实上这其实还是一个刚起步的领域,每周都会有新的东西诞生。

最后一个我想给你们的重要建议是,其实你也可以不像我之前说的那样做,形象点来说,机器学习就好像电脑一样。如果你真的想要一台电脑,你可以从头组装一台,或者你也可以直接买一台整机,这两件事最后的结果是一样的。我个人想要去学习如何从头构建神经网络因为,我是个控制欲很强的疯子。

有很多诸如,TensorFlow,PyTorch,Theano,Keras,和其他的机器学习框架,他们就好像是一台装好的电脑,你可以直接开始看教程,开始学习怎样去使用它们,你不需要关心很多,诸如导数,矩阵乘法,激活函数这些概念,这些机器学习框架已经把大多数复杂的事情做好了,不过显而易见的,以此为代价的就是,当网络内部出现问题,或者运行不正确时,找出哪里出现问题,会是件很困难的事,这都取决于你想要什么。

不管怎么样,请一定要记得满足你的好奇心,在机器学习的道路上走得越来越远。

视频原址 https://www.youtube.com/watch?v=I74ymkoNTnw

原文发布于微信公众号 - AI研习社(okweiwu)

原文发表时间:2018-04-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器学习算法与Python学习

干货|浅谈强化学习的方法及学习路线

一、介绍 目前,对于全球科学家而言,“如何去学习一种新技能”成为了一个最基本的研究问题。为什么要解决这个问题的初衷是显而易见的,如果我们理解了这个问题,那么我们...

42512
来自专栏量子位

史上最强GAN:训练费10万起,现在免费体验,画风鬼畜又逼真

9月底轰动业界的史上最强GAN,也就是最高动用512个TPU训练的BigGAN,Demo已经正式放出!

1753
来自专栏思影科技

语言网络的短期迅速重组

来自德国马克斯普朗克研究所(Max Planck Institute,Germany)的Gesa Hartwigsen等人在eLIFE期刊上发表了一片文章,研究...

2958
来自专栏AI科技评论

百度ICML论文:如何用一种算法同时解决中英两种语言的语音识别需求

论文作者:Dario Amodei , Rishita Anubhai , Eric Battenberg , Carl Case , Jared Casper...

44512
来自专栏AI研习社

推荐三个 Udacity 无人驾驶纳米项目的感知项目

本文为 AI 研习社编译的技术博客,原标题 Perception Projects from the Self-Driving Car Nanodegree P...

2942
来自专栏CSDN技术头条

WSDM 2017精选论文解读

人工智能和机器学习领域的学术论文汗牛充栋。每年的各大顶级会议、研讨班录用好几千篇论文,即便是亲临现场也很难追踪到所有的前沿信息。在时间精力有限的情况下,选择精读...

2906
来自专栏大数据文摘

小白学数据 | 除了计算大姨妈周期,时间序列分析还有什么用

2265
来自专栏量子位

超火的漫画线稿上色AI出新版了!无监督训练,效果更美好 | 代码+Demo

夏乙 安妮 编译整理 量子位 出品 | 公众号 QbitAI 给喜欢的动漫形象建个了收藏夹,里面收集她的各种图片……懂,谁没几个喜欢的动漫萌妹呢。 一些手绘线稿...

3683
来自专栏机器学习算法原理与实践

强化学习(一)模型基础

    从今天开始整理强化学习领域的知识,主要参考的资料是Sutton的强化学习书和UCL强化学习的课程。这个系列大概准备写10到20篇,希望写完后自己的强化学...

1633
来自专栏新智元

AI当“暖男”:给裸照自动穿上比基尼

【新智元导读】AI可以用来鉴黄,但有时会把含裸女的古典名画过滤掉。巴西的一组研究人员在JICNN上展示了一种新方法,使用生成对抗网络,给女性裸体照“穿上”比基尼...

1222

扫码关注云+社区

领取腾讯云代金券