机器学习/机器智能/人工智能/深度学习这些都是些啥?

Numenta•Jeff Hawkins & Donna Dubinsky

我们经常被问到我们如何区分我们与其他人的技术。这个任务由于没有公认的词汇而变得困难; 每个人都不同地使用上述术语(和其他相关术语)。此外,这些术语中的一些的一般理解的含义会随着时间的推移而演变。 1960年的AI的意思与今天的意思截然不同。我们认为,建立智能机器主要有三种主要方法。这些方法为经典AI,简单神经网络和生物神经网络。本博客的剩下部分将描述和区分这些方法。最后,我们将讲述三个例子,说明每种方法如何解决同样的问题。因为这个分析是针对业务而不是技术的受众,所以我们简化了一些细节。

Classic AI Approach

最早的AI方法是计算机程序,旨在解决人类大脑很容易执行的问题,如理解文本或识别图像中的对象。但这项工作的结果令人失望,进展缓慢。对于许多问题,研究人员得出结论,计算机必须获得大量的知识才能“聪明”。因此,他们引入了“专家系统”,计算机程序结合专家提供的规则,以解决问题,如医疗诊断,通过提出一系列问题。如果疾病没有被正确诊断,专家添加额外的问题/规则来缩小诊断范围。经典AI系统针对特定问题高度优化。

IBM的Watson可以被视为经典AI系统的现代版本。它专注于在特定问题上进而创建一个复杂的知识库。尽管Watson不依赖于编码规则,但它需要专家的密切参与来提供数据并评估其性能。经典AI已经解决了一些明确定义的问题,但受限于它无法自己学习,以及需要为个别问题创建具体的解决方案。在这方面,尽管它被称为人工智能,但与一般人类智力很少有共同点。

Simple Neural Network Approach

一些早期的研究人员探索了神经元模型并建立人工智能的想法。当经典AI的界限变得越发明确时,这个概念吸取了steam的想法,并且增加了反向传播技术,于是开始证明这样是有效果的。最终的技术,人工神经网络(ANNs)已经创建了50多年了,即使很少人知道真正的神经元如何工作。从那时起,神经科学家已经学习了很多关于神经解剖和生理学知识,但是ANN的基本设计变化很小。因此,尽管命名神经网络,ANN的设计与真实神经元很少有共同点。相反,ANN的重点从生物现实主义转移到在没有人类监督的情况下从数据中学习的愿望。因此,简单神经网络相对于传统AI的巨大优势在于它们是从数据中学习并且不需要专家提供规则。今天,ANN被认为是“机器学习”的一部分,“机器学习”包括了数学和统计技术。机器学习技术,包括ANN,使用大量数据,并提取统计数据和分类结果。

ANN最近已发展成为深度学习网络,其进步已通过利用计算机快速运算能力和大量数据用于训练而实现。深度学习已经成功地解决了许多问题,如图像分类,语言翻译和识别电子邮件中的垃圾邮件。

虽然简单神经网络系统可以解决使用经典AI不可解决的许多问题,但是它们具有局限性。例如,当训练数据有限时,它们不具有很好的效果,并且不能处理数据中的模式不断变化的问题。本质上,简单神经网络方法是一种复杂的数学技术,它在大的静态数据集中找到一种模式。除了经典AI和简单神经网络的限制之外,还有一个更深层和更重要的问题。在我们看来,这两种方法都不是在实现真正的机器智能的道路上; 他们没有提供方法来到那里,这让我们想到了第三种方法。

Biological Neural Network Approach

每个人都同意人类的大脑是一个智能系统。事实上它是唯一的大家都同意是智能的系统。我们相信,通过研究大脑如何工作,我们可以了解什么是智能,大脑的什么属性对智能系统至关重要。例如,我们知道大脑使用稀疏分布表示(SDR)来表示信息,这对于语义泛化和创造力是至关重要的。我们有信心,所有真正的智能机器将基于SDR。 SDR不是可以添加到现有机器学习技术的东西;他们更像是一切依赖的基础。其他基本属性包括记忆,主要是一系列模式,这种行为是所有学习的重要组成部分,而且学习必须是连续的。此外,我们现在知道生物神经元比简单神经网络方法中使用的简单神经元复杂得多 - 差异很重要。我们相信,你不能通过逐步建立在简单的神经元方法上获得机器智能,而是必须把它丢弃,用更现实的生物学方法重新开始。

Numenta的技术,分层时间内存(HTM),是生物神经网络方法的最好的例子。今天,HTM系统能够学习流数据的结构,进行预测和检测异常。他们从未标记的数据中不断学习。通过采取强大的生物学方法,大脑给了我们一个路线图,指导我们在未来的工作,如完成对行为,注意力和短期记忆的理解。该路线图将HTM与其他技术区分开来,使其成为创建智能机器的最佳选择。

An Example

让我们考虑一个问题,并考虑如何用三种不同的方法解决它。 再次,我们进行了过分简化了,以区分三种方法的主要区别。我们被要求检测组织内员工的流氓行为。例如,具有机密信息的公司想知道具有内部访问权限的人是否滥用该信息。员工行为的变化可能是完全合法的 - 员工已经改变了角色,现在有了新的责任 - 或者这可能是一个问题。

流氓行为很难识别。 经典AI方法将通过一系列规则来解决这个问题。 例如,让我们考虑使用保密客户数据的分析师。 经典AI系统需要一个人来找出可能的问题情景,然后对系统进行编程以寻找这些情景。此解决方案可能会标记分析人员在本月访问客户文件超过10次的任何实例。随着经典AI系统的部署,检查假阳性和假阴性,规则将得到加强。新规则可能会说,在一个月的前几天访问客户数据的分析人员没有被标记,但是在一个月的其余时间被标记了。

简单神经网络方法将从许多历史数据开始,即已知问题情形的大数据库。简单神经元网络系统可能会发现,例如,这种信息的滥用只发生在一个月的最后一周。系统识别这样的特征,然后将个人分类为“常见”或“不常见”。虽然它听起来类似于经典AI方法,在这种情况下,特征是从数据,而不是从专家学习。

这两种方法都有一些问题。 使用经典AI解决方案,您需要知道您要找什么。 但犯事者不断地改变战略,以避免检测,那规则就不适应了。 简单神经网络方法需要大量的标记数据才能找到共同的特征,但这种数据通常不存在异常行为。这两种方法都不适合于对单个行为进行建模,并且需要在出现新模式时重新训练系统。

生物神经网络方法将流式处理来自每个分析者的数据(例如常规访问文件的细节,电子邮件的数量,发布的数量等),并且将自动地建立每个人的正常行为的单独模型。然后系统将预测每个分析者的正常情况,并标记任何异常。人们可以stream许多不同的度量,而不知道哪些是重要的 - 因为所有的建模都是自动的。生物神经网络系统不需要知道它在寻找什么,它可以单独建模每个人,并将随着数据的变化而不断学习。

Classic AI

Simple Neural Network

Biological Neural Network

Examples

Watson

Deep Learning

Hierarchical Temporal Memory (HTM)

Associated terms

Expert systems

Artificial Neural Nets (ANN) Machine learning

Machine intelligence

Data sources

Rules from experts

Large datasets

Data streams

Training

Programmed by experts

Derived from labeled databases

Derived from unlabeled data streams

Outputs

Answers to questions

Classification

Prediction Anomaly detection Classification

Batch vs. continuous learning

Batch

Batch

Continuous

Need to know what you are looking for

Yes

Requires labeled data

No

Many individual models

Hard

Hard

Easy

Biological basis

None

Simple

Realistic

Provides roadmap to machine intelligence

No

No

Yes

我们回到我们开始的问题。 我们的感觉是,术语“人工智能”已经在许多方面开始使用了,但现在它的表述很混乱。人们使用AI来指代上述所有三种方法加上其他方法,因此这变得几乎没有意义了。术语“机器学习”是对于从数据学习的机器的更窄的术语,包括诸如ANN和深度学习的简单神经模型。我们使用术语“机器智能”来指代学习但与生物神经网络方法一致的机器。虽然我们还有很多工作要做,但我们相信生物神经网络方法是实现真正智能机器的最快和最直接的途径。

原文发布于微信公众号 - 鸿的学习笔记(shujuxuexizhilu)

原文发表时间:2016-11-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

大手笔!YouTube放出史上最大已标注视频数据集

以下内容来自Google Research Blog,量子位编译 ? 当今机器学习中最具挑战性的研究领域之一,是使计算机能够理解一个场景是什么。例如,虽然人类知...

253100
来自专栏IT派

量子机器学习入门科普:解读量子力学和机器学习的共生关系

IT派 - {技术青年圈} 持续关注互联网、大数据、人工智能领域 原作:Reena Shaw 安妮 编译自 KDnuggets 量子位 出品 | 公众号 Qb...

41160
来自专栏新智元

【重磅】AI 自动研发机器学习系统,DeepMind 让算法学习强化学习(附论文)

【新智元导读】眼下,人工智能研发的一个大方向是用AI系统来自动化开发AI系统。虽然这一目标尚未实现,但目前的进展让已足够令人人震惊。本文介绍了最新的一些进展,包...

38380
来自专栏企鹅号快讯

计算机视觉:让冰冷的机器看懂多彩的世界

作者:微软亚洲研究院 链接:https://www.guokr.com/article/439945/ 2010年,来自斯坦福大学、普林斯顿大学及哥伦比亚大学的...

47090
来自专栏大数据文摘

AI = 神经网络?这8个技术就不是!

10520
来自专栏AI2ML人工智能to机器学习

Amazon Sage​Maker启示录

在“机器学习模型常见对比”我们聊了机器学习常见模型, 在“R语言和表数据分析”里面我们解读了数据处理一般流程。

17140
来自专栏AI科技评论

清华大学柯沛:闲聊对话中的句式控制 | AI研习社65期大讲堂

AI 科技评论按:在闲聊对话领域,对话策略研究是近几年的热门话题,实现对话策略需要引入一些要素,让聊天机器人变得更加拟人化,以便能跟用户更好地交互。来自清华大学...

11220
来自专栏新智元

人类将可能操控AI?神经网络语言处理工作原理被破解

作者:刘光明 【新智元导读】近期,来自麻省理工学院计算机科学人工智能实验室(CSAIL)和卡塔尔计算研究所的研究人员已经通过新的解释技术,来分析神经网络做机器...

34740
来自专栏EAWorld

AIDevOps离我们有多远?

本文目录: 一、写在前面 二、AIDevOps,未来已来 三、AIDevOps的方法 四、学术界的研究启示 五、距离AIDevOps还有多远? 六、参考文献 一...

43660
来自专栏新智元

【ICCV 13大不可错过的有趣项目】实时任意风格迁移、手机照片背景模糊……

来源:techcrunch 作者:Devin Coldewey 编译:马文 【新智元导读】计算机视觉领域顶会之一的 ICCV 结束不久,图像质量提升、从头创建...

42170

扫码关注云+社区

领取腾讯云代金券