Numenta•Jeff Hawkins & Donna Dubinsky
我们经常被问到我们如何区分我们与其他人的技术。这个任务由于没有公认的词汇而变得困难; 每个人都不同地使用上述术语(和其他相关术语)。此外,这些术语中的一些的一般理解的含义会随着时间的推移而演变。 1960年的AI的意思与今天的意思截然不同。我们认为,建立智能机器主要有三种主要方法。这些方法为经典AI,简单神经网络和生物神经网络。本博客的剩下部分将描述和区分这些方法。最后,我们将讲述三个例子,说明每种方法如何解决同样的问题。因为这个分析是针对业务而不是技术的受众,所以我们简化了一些细节。
Classic AI Approach
最早的AI方法是计算机程序,旨在解决人类大脑很容易执行的问题,如理解文本或识别图像中的对象。但这项工作的结果令人失望,进展缓慢。对于许多问题,研究人员得出结论,计算机必须获得大量的知识才能“聪明”。因此,他们引入了“专家系统”,计算机程序结合专家提供的规则,以解决问题,如医疗诊断,通过提出一系列问题。如果疾病没有被正确诊断,专家添加额外的问题/规则来缩小诊断范围。经典AI系统针对特定问题高度优化。
IBM的Watson可以被视为经典AI系统的现代版本。它专注于在特定问题上进而创建一个复杂的知识库。尽管Watson不依赖于编码规则,但它需要专家的密切参与来提供数据并评估其性能。经典AI已经解决了一些明确定义的问题,但受限于它无法自己学习,以及需要为个别问题创建具体的解决方案。在这方面,尽管它被称为人工智能,但与一般人类智力很少有共同点。
Simple Neural Network Approach
一些早期的研究人员探索了神经元模型并建立人工智能的想法。当经典AI的界限变得越发明确时,这个概念吸取了steam的想法,并且增加了反向传播技术,于是开始证明这样是有效果的。最终的技术,人工神经网络(ANNs)已经创建了50多年了,即使很少人知道真正的神经元如何工作。从那时起,神经科学家已经学习了很多关于神经解剖和生理学知识,但是ANN的基本设计变化很小。因此,尽管命名神经网络,ANN的设计与真实神经元很少有共同点。相反,ANN的重点从生物现实主义转移到在没有人类监督的情况下从数据中学习的愿望。因此,简单神经网络相对于传统AI的巨大优势在于它们是从数据中学习并且不需要专家提供规则。今天,ANN被认为是“机器学习”的一部分,“机器学习”包括了数学和统计技术。机器学习技术,包括ANN,使用大量数据,并提取统计数据和分类结果。
ANN最近已发展成为深度学习网络,其进步已通过利用计算机快速运算能力和大量数据用于训练而实现。深度学习已经成功地解决了许多问题,如图像分类,语言翻译和识别电子邮件中的垃圾邮件。
虽然简单神经网络系统可以解决使用经典AI不可解决的许多问题,但是它们具有局限性。例如,当训练数据有限时,它们不具有很好的效果,并且不能处理数据中的模式不断变化的问题。本质上,简单神经网络方法是一种复杂的数学技术,它在大的静态数据集中找到一种模式。除了经典AI和简单神经网络的限制之外,还有一个更深层和更重要的问题。在我们看来,这两种方法都不是在实现真正的机器智能的道路上; 他们没有提供方法来到那里,这让我们想到了第三种方法。
Biological Neural Network Approach
每个人都同意人类的大脑是一个智能系统。事实上它是唯一的大家都同意是智能的系统。我们相信,通过研究大脑如何工作,我们可以了解什么是智能,大脑的什么属性对智能系统至关重要。例如,我们知道大脑使用稀疏分布表示(SDR)来表示信息,这对于语义泛化和创造力是至关重要的。我们有信心,所有真正的智能机器将基于SDR。 SDR不是可以添加到现有机器学习技术的东西;他们更像是一切依赖的基础。其他基本属性包括记忆,主要是一系列模式,这种行为是所有学习的重要组成部分,而且学习必须是连续的。此外,我们现在知道生物神经元比简单神经网络方法中使用的简单神经元复杂得多 - 差异很重要。我们相信,你不能通过逐步建立在简单的神经元方法上获得机器智能,而是必须把它丢弃,用更现实的生物学方法重新开始。
Numenta的技术,分层时间内存(HTM),是生物神经网络方法的最好的例子。今天,HTM系统能够学习流数据的结构,进行预测和检测异常。他们从未标记的数据中不断学习。通过采取强大的生物学方法,大脑给了我们一个路线图,指导我们在未来的工作,如完成对行为,注意力和短期记忆的理解。该路线图将HTM与其他技术区分开来,使其成为创建智能机器的最佳选择。
An Example
让我们考虑一个问题,并考虑如何用三种不同的方法解决它。 再次,我们进行了过分简化了,以区分三种方法的主要区别。我们被要求检测组织内员工的流氓行为。例如,具有机密信息的公司想知道具有内部访问权限的人是否滥用该信息。员工行为的变化可能是完全合法的 - 员工已经改变了角色,现在有了新的责任 - 或者这可能是一个问题。
流氓行为很难识别。 经典AI方法将通过一系列规则来解决这个问题。 例如,让我们考虑使用保密客户数据的分析师。 经典AI系统需要一个人来找出可能的问题情景,然后对系统进行编程以寻找这些情景。此解决方案可能会标记分析人员在本月访问客户文件超过10次的任何实例。随着经典AI系统的部署,检查假阳性和假阴性,规则将得到加强。新规则可能会说,在一个月的前几天访问客户数据的分析人员没有被标记,但是在一个月的其余时间被标记了。
简单神经网络方法将从许多历史数据开始,即已知问题情形的大数据库。简单神经元网络系统可能会发现,例如,这种信息的滥用只发生在一个月的最后一周。系统识别这样的特征,然后将个人分类为“常见”或“不常见”。虽然它听起来类似于经典AI方法,在这种情况下,特征是从数据,而不是从专家学习。
这两种方法都有一些问题。 使用经典AI解决方案,您需要知道您要找什么。 但犯事者不断地改变战略,以避免检测,那规则就不适应了。 简单神经网络方法需要大量的标记数据才能找到共同的特征,但这种数据通常不存在异常行为。这两种方法都不适合于对单个行为进行建模,并且需要在出现新模式时重新训练系统。
生物神经网络方法将流式处理来自每个分析者的数据(例如常规访问文件的细节,电子邮件的数量,发布的数量等),并且将自动地建立每个人的正常行为的单独模型。然后系统将预测每个分析者的正常情况,并标记任何异常。人们可以stream许多不同的度量,而不知道哪些是重要的 - 因为所有的建模都是自动的。生物神经网络系统不需要知道它在寻找什么,它可以单独建模每个人,并将随着数据的变化而不断学习。
Classic AI | Simple Neural Network | Biological Neural Network | |
---|---|---|---|
Examples | Watson | Deep Learning | Hierarchical Temporal Memory (HTM) |
Associated terms | Expert systems | Artificial Neural Nets (ANN) Machine learning | Machine intelligence |
Data sources | Rules from experts | Large datasets | Data streams |
Training | Programmed by experts | Derived from labeled databases | Derived from unlabeled data streams |
Outputs | Answers to questions | Classification | Prediction Anomaly detection Classification |
Batch vs. continuous learning | Batch | Batch | Continuous |
Need to know what you are looking for | Yes | Requires labeled data | No |
Many individual models | Hard | Hard | Easy |
Biological basis | None | Simple | Realistic |
Provides roadmap to machine intelligence | No | No | Yes |
我们回到我们开始的问题。 我们的感觉是,术语“人工智能”已经在许多方面开始使用了,但现在它的表述很混乱。人们使用AI来指代上述所有三种方法加上其他方法,因此这变得几乎没有意义了。术语“机器学习”是对于从数据学习的机器的更窄的术语,包括诸如ANN和深度学习的简单神经模型。我们使用术语“机器智能”来指代学习但与生物神经网络方法一致的机器。虽然我们还有很多工作要做,但我们相信生物神经网络方法是实现真正智能机器的最快和最直接的途径。