【指南】非技术人员的机器学习指南:如何轻松地进入机器学习

世界末日

首先,我们听说机器人正在做蓝领工作。

然后,我们发现白领工作也不安全。

在我们恐慌我们将要失业,我们发现这些机器人正在背后议论我们。

可能是关于我们这些懒惰的失业人员的流言蜚语。

机器学习在许多不同的环境中都被讨论过,很难理解它到底是什么。你查一下,会得到很抽象的理论解释:高功率的拼字游戏,数学和代码墙。

你只是想知道什么是机器学习,为什么它很重要,以及它是如何工作的。老实说,你只是想弄明白所有的流行语,就像在中学的教室里骂脏话:每个人都在用它们,但你有一种感觉,没有人知道他们到底是什么意思。

让我们一探究竟

所以,机器学习,是…人工智能吗?

这是一个很好的开始。我们都知道人工智能的含义。我的意思是,我们都在思考不同的事情,但这确实是一种想法。

人工智能(AI)是建立可以做出“智能”决策的系统的研究。

基本上,如果电脑做了一些看起来很聪明的事情,我们就把它标记为人工智能。

我们来举个例子吧。电脑游戏经常会出现一些看起来很聪明的敌人。他们跟随我们,他们的行为方式使游戏更具挑战性。这是人工智能的一个例子。

游戏开发者通过给人工智能制定一套规则来实现这个目标。以玩家为例,如果玩家正在射击,那就找掩护。如果玩家停止射击,试着向玩家射击。游戏规则越多,游戏看起来就越智能。

问题是,电脑游戏通常是相当有限的。玩家只能执行一些特定的动作,而这个级别完全由开发人员设计。因此,开发人员可以为那些看起来非常聪明的人工智能角色制定规则。

不是所有的问题都可以用规则来解决

假设我们想要一台电脑来检测这是不是狗的照片。

试着想想我们需要什么样的规则。

狗有四条腿吗? 狗是白色的吗? 狗有毛吗?

计算机视觉问题,就像识别物体一样,是非常复杂的。但我们的大脑几乎凭直觉就能解决它们。所以,我们很难提出明确的规则。

进入机器学习

我们并没有建立一个识别狗的系统。我们建立了一个可以学会识别狗的系统。

我们给它提供了成千上万的图像,有些是狗,有些不是。系统学习了定义狗的图像的规则。

机器学习是建立可以学习做出明智的决定的研究。

关键字“学习”是机器学习与其他类型人工智能的区别所在。

你说机器可以学习规则。很明显,规则确实存在。我们只是尽全力去找到他们。

这绝对是正确的。如果我们努力尝试,我们可能会开发出一种基于规则的狗狗探测系统。它将有成千上万条规则,涵盖每一个可能的场景,这将是一件非常好的事。

如果我们现在想让系统检测包含食物的图像呢?好吧,我们扔掉所有的东西,从头开始。这些规则都不适用。

能学会识别目标的系统可以通过使用食物图片来识别食物,而不是狗。

这就是机器学习的力量。没有固定的规则,我们可以灵活的学习和适应。

保持真实

现在,听起来完全像我们建立了一个生动的学习系统,并且教它识别狗。然后我们教它可爱与爱的含义,然后希望它不要反抗并杀死我们。

现实情况不是这样的,相比起来要简单得多。我们希望机器学会基于预测做决定。让我们从这个问题开始:人类是如何预测的?

这里有一个我们如何预测的例子。你甚至可能在中学的科学课上做过类似的事情。

假设你做了一个实验。你收集数据,并在图表上画出来。

x轴是你改变的值,y轴是你测量的结果。然后在图上画一条趋势线(或最佳拟合线)。

这是最好的数据模型。

现在你有了这条线,你就可以做出预测了。你可以选择一个你从未测量过的权值,在x轴上找出它的位置,然后读出y轴来预测弹簧的长度。

你使用数据建立了一个模型,并用它来做出预测。如果你编写了一个可以执行这些步骤的程序,那么恭喜你:这就是机器学习。找到线性模型并利用它进行预测:这完全是一种机器学习技术,称为线性回归。

我们本可以把模型编进系统。这个系统可以预测该弹簧的情况。但如果没有我们编写新的代码,它就不能预测其他的弹簧。相反,如果我们教这个程序来执行线性回归并学习模型,那就是机器学习。我们不提供模型。我们让机器学习模型。

魔法

有一件东西是你需要从这个例子中学到的,那就是:

机器学习不是魔法。

我们并不是在建立一个可以学习一切的自我意识。弹簧模型程序永远不会学会识别狗。

我们建立了一个可以学习特殊类型的模型系统。我们所遗漏的只是模型。

几乎每一个机器学习系统都做了以下版本:

系统根据模型给出一个输出。它对输出进行评估,以确定它有多糟糕。然后更新模型,以改善接下来的输出。

机器学习是构建系统的艺术,它可以为特定的问题执行这个循环。

根据问题的不同,输出可能有很大的不同。它可能是聊天机器人的文本回应。或者是决定是否在自动驾驶汽车上踩刹车。

在我们的弹簧问题中,实际的模型可能是线性的。它可能是一个基于统计和概率的更复杂的模型。或者,它可以是一个神经网络,旨在模仿人类大脑的工作方式:

  • 链接地址为:https://hackernoon.com/neural-networks-the-1-minute-guide-a2909507f350

不管细节是什么,几乎每一个机器学习系统都在运行这个循环。在每一个周期中,系统都会提高一点点。在经历了数千次甚至上百万次的循环之后,我们可以获得比任何人类都更好的系统。

各种各样的应用程序,以及解决它们所需的技术,是机器学习与其他许多领域的交叉的原因。这也是为什么机器学习是如此令人感兴趣的原因。

构建机器学习系统可能很复杂,但理解机器学习并不一定是必要的。

所以,去征服它吧。你只需要再做几年,真的。到那时,我相信会有机器人来为你做这些。

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2017-11-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏IT派

有趣!用计算机视觉技术与PaddlePaddle打造AI控烟项目

百度工程师用 PaddlePaddle 训练出一套模型,能够对吸烟人群进行识别和适当提示。当摄像头捕捉到正在吸烟的同学,就会投射到大屏幕上。图为李彦宏和某个员工...

792
来自专栏CreateAMind

智能机器的现实风险

当人们问我是干什么的,我常常对回答的深度感到困惑。说“人工智能”我很满意,但太宽泛,而说“图像处理”可能又太具体。然而,一听到接下的来的毫不相干的问题我总是气不...

671
来自专栏华章科技

独家 | 一文读懂推荐系统知识体系(附学习资料)

推荐系统就是根据用户的历史行为、社交关系、兴趣点、所处上下文环境等信息去判断用户当前需要或感兴趣的物品/服务的一类应用。

1066
来自专栏AI科技评论

解惑 | Yann LeCun答深度学习现存的各类疑问,你是否想知道答案?

联合编译:陈圳,高斐,章敏 深度学习的局限性表现在哪些方面? 深度学习的一些“典型”形式包括各种前馈模块(卷积网络)和递归网络(有时以记忆单元,如LSTM或M...

3307
来自专栏人工智能快报

谷歌推出通用机器学习模型

据外媒报道,谷歌的研究人员已经运用多种类型的训练数据创立了他们所谓的“一个模型解决所有问题”,以此在不同的任务中训练人工智能模型。 研究人员和专注于人工智能的谷...

3073
来自专栏数据科学与人工智能

数据科学学习误区

“平衡是一门艺术,也是一种智慧” ——数据人网 如何学习数据科学知识? 如何利用数据科学知识解决好数据问题,实现数据变现? 如何通过数据科学的学习,从...

2624
来自专栏大数据文摘

怎样找到一份深度学习的工作 | 附学习材料,资源与建议

1654
来自专栏PPV课数据科学社区

技术帖:解析今日头条公开的推荐算法

1月11日,北京今日头条总部,一场问诊算法、建言算法的“让算法公开透明”分享会正在进行,雷锋网(公众号:雷锋网)观察到,包括BAT等在内的诸多科技公司算法工程师...

4609
来自专栏数据派THU

独家|盘点5个TensorFlow和机器学习课程,程序员福利(附资源)

本文为你介绍5个有关TensorFlow的机器学习课程,来帮助你进一步了解数据科学和人工智能。

724
来自专栏钱塘大数据

吴恩达回答:深度学习的泡沫何时会破?

有人在 Quora 上问了一个匪夷所思的问题:“深度学习的泡沫何时会破?”在短短的十几个小时内,该问题就得到了 18 个回应,而且每个回应都颇有深度。下面的内容...

3525

扫码关注云+社区