人工智能凭借什么过关斩将？| 机器学习算法大解析

AI 电堂

发布于 2020-09-18 11:28:46

5280

发布于 2020-09-18 11:28:46

文章被收录于专栏：AI电堂

本篇是人工智能专辑文章的第二篇，为大家归类总结人工智能的三类工作方式、九大算法及五大应用系统。

人工智能到底是如何工作的？包含哪些常见的机器学习机制和主要算法？接下来的内容可能会有些烧脑，但足以让你对人工智能实施的主要方法有个全局的了解。

三类工作方式

机器学习从数据中提取信息，按照工作方式把它分成三个主要的类别：监督学习、无监督学习和强化学习。

监督学习 如果数据集包含已知的输入和输出对，称为监督学习。监督学习使用一组训练数据来预测未知数据集的输出值。使用监督学习开发的模型的性能取决于所采用的训练数据集的大小和方差(数据选择)，以实现更好的泛化和对新数据集更好的预测能力。

无监督学习 在不定义预先指定属性的情况下学习对数据集的实例进行分组，称为无监督学习。该算法无需目标条件信息即可确定数据集的基础结构。

强化学习 在强化学习中， AI系统以代理的形式与环境交互。代理能够操作并观察环境，并以奖惩的形式接收环境的反馈，通过执行动作并接收针对所述动作的奖惩来改进学习效果。通过重复执行动作并接收反馈，代理就可以更好地通过价值函数近似估计执行动作的价值。

▲ 强化学习

九大算法

决策树 适用于分类和回归任务，是监督学习算法的一种形式。决策树使用训练数据以图形方式概述决策规则及其结果。分类树会产生分类或离散结果，而回归树会预测连续值。因为容易解释、准确性高，决策树成为非常流行的机器学习技术。

▲ 决策树

支持向量机 SVM算法处理监督机器学习问题，可应用于分类和回归任务。该算法的基本概念是线性划分不同的类别，将数据集提供的类之间的距离最大化。为了实现最佳的分类，该算法使用可以令不同类别之间的间隔最大化的数据点。定义了分隔开不同类别的直线上的那些被选中的数据点叫做支持向量，这就是SVM算法名称的由来。

朴素贝叶斯 是一类基于贝叶斯定理的监督学习算法。有一个普遍的假设，即所有这些算法都可以共享以对数据进行分类。被分类数据的每个特征都独立于该类别中所有其它特征。当一个特征的值发生变化对其它特征的值没有影响时，认为该特征是独立的。贝叶斯算法被应用于文本检索或垃圾邮件分类等许多任务。

k最近邻 k-NN算法通常用于监督分类和回归，但也可以应用于无监督聚类。该算法被称为惰性学习者，因为只需要保存数据直到需要对新数据进行分类，根据存储的数据点对新数据进行分类，因此分类结果始终取决于当前的训练数据。k-NN算法的基本思想是根据与待分类数据距离最近的k个数据点对数据进行匹配分类。

▲ K最近邻

k均值聚类 聚类问题中提供了一个未标记的数据集，聚类算法将其自动分组为相干的子集或聚类。k均值算法是用于此类任务的最受欢迎的算法之一。k均值算法首先随机初始化数据集中的k个随机点 (称为聚类质心)。然后重复执行两个步骤：分配和质心重定位。在聚类分配步骤中，该算法遍历给定数据集中的每个样本，并根据最近距离将每个样本分配给一个初始化的质心。对每个数据点重复此操作，直到将每个样本分配给一个簇。第二步，算法计算分配给特定簇的每个数据点的平均距离，然后将质心移动到计算出的平均位置。对所有k个簇重复该步骤。该算法进行迭代，直到聚类质心不再变化为止，这意味着k均值算法已收敛到k个聚类。

隐马尔科夫模型 HMM是一种创建线性序列概率模型的有用算法。该算法的基本概念是马尔可夫过程，它假设系统在任何时候都可以被描述为处于一组独特的状态。在间隔开的离散时间上，系统根据与状态相关的一组概率在状态之间变化。马尔可夫模型中的隐藏状态表示不可直接观测的随机过程，它只能通过另一组产生观测序列的随机过程间接观测。HMM的应用范围包括DNA和蛋白质分析中的序列建模、信息检索系统和音频测序。

人工神经网络 人工神经网络（ANN）是受到人脑启发诞生的一种基于神经网络(感知器)的算法，具有很强的通用性。一个神经网络由多个不同的层组成，每一层都包含与上一层所有人工神经元相连的人工神经元。输入层表示输入数据，由数值组成，可以处理结构化数据(例如温度传感器输出)和非结构化数据(例如图像像素)。根据隐藏层中哪些单元被激活，输出层单元将提供预测。

▲ 人工神经网络

卷积神经网络 (CNN)与普通ANN有很多相似之处。它们同样都由神经元组成，而且这些神经元的权重和偏差会在学习过程中进行调整。整个网络仍表示单个可区分的得分函数，并且有一个成本函数链接到最后一个全连接层上。但是，与常规前馈神经网络相反，CNN明确假定其输入为图像，它们可以将某些属性编码到网络的体系结构中，让前向函数的实现更加有效，并且大大减少了参数的数量。

递归神经网络 (RNN)是一种特殊类型的人工神经网络。它们可以应用于监督学习和无监督学习，也可以用于强化学习。ANN在把当前输入数据考虑进去时假设它们和之前的数据无关，但RNN能够计入之前数据的影响。ANN的神经元只有来自先前层的输入，但RNN神经元的输出上带有循环，因此RNN的神经元对其先前的输出具有依赖性。这种特性使得此类算法能够覆盖序列预测问题，例如单词的语境或时间关系。