AI变身记：不光能有人的智能，还要像狗一样“思考”

用户1737318

发布于 2018-06-05 12:17:58

6400

文章被收录于专栏：人工智能头条人工智能头条

译者 | 林椿眄

编辑 | Just

出品 | 人工智能头条（公众号ID：AI_Thinker）

【人工智能头条导读】通常，我们的人工智能系统都是以人的视角去构造的，这些系统已经用于自动驾驶、人脸识别、操作重型机器，甚至检测疾病。那么，我们可以从动物的角度构建一个智能系统吗？比如让 AI 去模拟狗的行为。

华盛顿大学与 Allen 人工智能研究所的研究人员最新的论文公开了他们开发的一种深度学习系统，该系统可以训练并模拟狗的行为特征。研究人员表示训练智能机器的目标是使其能够充当一个智能视觉体的角色。不过，让智能机器充当狗的角色这个想法是非常具有挑战性的任务。

▌简介

我们研究了如何直接构建一个视觉智能体（visually intelligent agent）。通常，计算机视觉技术专注于解决与视觉智能相关的各种子任务。但我们的研究不同于这种标准的计算机视觉方法。相反，我们尝试直接构建一个视觉智能体，我们的模型将视觉信息作为输入，并直接预测智能体在未来的行为。

此外，我们引入了 DECADE 数据集，这是一个以狗的视角所搜集的狗的行为数据集。利用这些数据，我们可以模拟狗的行为和动作规划方式。在多种度量方法下，对于给定的视觉输入，我们成功地构建了一个视觉智能体，它能够准确预测并模拟狗的行为。不仅如此，与图像分类任务学到的特征表征相比，我们的智能体学习到的特征能够编码不同的信息，也可以推广到其他领域。尤其需要指出的是，通过将这种狗的建模任务作为表示学习，我们在可行走区域预测和场景分类任务中取得非常卓越的结果。

▌方法与模型

为了训练，研究人员使用了一个叫做 Kelp 的阿拉斯加雪橇犬，并在其腿部配备了 GoPro 相机，尾部和后备箱上配备六个惯性测量传感器，一个麦克风以及一个把这些数据绑在一起的 Arduino 开发板。研究人员在超过 50 个不同的地点，在长达数小时的时间内，记录了 Kelp 的活动数据，如步行、追踪、抓取，与其他狗互动以及跟踪物体等。利用英伟达提供的 GeForce GTX 1080 GPU，TITAN X GPU 以及 cuDNN 加速的深度学习框架，研究人员用所获得的视觉和感官信息来训练神经网络。

在这里，研究人员解决了三个问题：

像狗一样行动：根据一系列先前看到的图像,神经网络的目标是预测狗未来的运动轨迹；
像狗一样规划：目标是找到一系列动作，让狗在给定的一对图像的位置之间移动。
从狗身上学习：我们将学习的表现用于第三项任务（如可行走的表面评估（Walkable surface estimation），预测狗的可行走区域）。

这些任务需要一些相当复杂的数据：例如，就像真的狗一样，我们的 AI 系统必须知道，当它需要从一个地点移动到另一地点的时候，可行走区域的位置有哪些。它不能在树上或汽车上行走，也不能在沙发上行走（这也取决于房子）。因此，我们的模型也要学会这一点，它可以作为一个独立的计算机视觉模型，在一张给定图像中找出一个宠物（或一个有足机器人）所能够到达的位置。下面我们将逐一介绍这三个任务所用到的模型结构。

这是用于模拟狗的行为的模型结构。这个模型是一个编码-解码器结构的神经网络，编码器接收成对的图片流作为输入，而解码器输出每个节点未来的行动决策。在编码器和解码器之间有一个全连接层（FC），它能够更好地捕捉区域内的行为变化。在解码器中，每个时步输出的行动概率将被用于下一个时步（timestep）。我们在两个 ResNet 中共享模型的权重参数。