学界 | 神经网络quine:自我复制 + 解决辅助任务

选自arXiv

作者:Oscar Chang、Hod Lipson

机器之心编译

参与:程耀彤、路

近日,哥伦比亚大学的研究者发布论文,从生命的角度看待人工智能的发展。论文提出一种不寻常的自我复制神经网络,能够实现自我复制,还可以解决辅助任务,本论文使用 MNIST 图像分类作为辅助任务。

生物的生命是从第一次自我复制开始的(Marshall, 2011),而自然选择倾向于支持在复制方面更有优势的生物体,从而形成了自我完善机制。类似地,如果 AI 智能体能够在没有额外机器的情况下进行自我复制和完善,我们就可以通过自然选择构建一个人工智能的自我完善机制。

引言

在发现 DNA 作为生物复制的物理机制之前,人工自我复制机器的概念最早是由 John von Neumann 在 20 世纪 40 年代提出的。具体来说,Von Neumann 展示了细胞自动机的初始状态和变换规则的配置,它在运行固定步数后产生初始细胞状态的副本(Von Neumann & Burks,1966)。之后 Hofstadter(1980)在《Godel,Escher,Bach: an Eternal Golden Braid》一书中以哲学家 Willard Van Orman Quine 的名字创造了术语「quine」,用来描述自我复制的表达式,如:「是句子片段」是句子片段(『is a sentence fragment』 is a sentence fragment)。

在制作物理自我复制器方面也有很多研究。值得注意的例子有 tile(Penrose,1959)、分子(Wang et al.,2011)、聚合物(Breivik,2001)和机器人(Zykov et al.,2005)。

在编程语言理论的背景下,quine 是打印自己源代码的计算机程序。一个简单的 quine 示例是空字符串,在大多数语言中,编译器会转换为空字符串。下面的代码片段是一个不寻常的两行 Python quine 示例。

s = ’s = %r\nprint(s%%s)’ 
print(s%s)

虽然自我复制已经在许多自动机中被研究过,但在神经网络的研究中明显缺乏,尽管神经网络似乎是迄今为止已知的最强大的人工智能形式。

本论文识别并尝试解决构建和训练自我复制神经网络时所面临的挑战。具体来说,研究者建议将神经网络视为由一系列张量运算组成的可微计算机程序。研究目标是构建一个输出自己权重的神经网络 quine。

研究者使用三种不同方法对论文提出的方案进行测试:基于梯度的优化方法、基于非梯度的优化方法和一个叫作再生(regeneration)的新方法。研究者进一步设计了一个神经网络 quine,除了自我复制的工作外它还有一个辅助目标。本论文选择的辅助任务是 MNIST 图像分类(LeCun & Cortes,1998),任务涉及将从 0 到 9 的数字图像进行分类,它通常用作机器学习的「hello world」示例。

研究者观察到网络在自我复制能力与解决辅助任务能力之间有一个权衡。这与在自然界中观察到的繁殖与其他辅助生存任务之间的平衡类似。这两个目标通常是一致的,但是比如当一只动物处于饥饿状态时,其性激素通常会下调,以牺牲繁殖为代价优化生存。反之亦然:例如,雄性深色捕鱼蛛的交配行为导致其血压发生突然的、不可逆转的变化,这使其无法移动并容易被雌性蜘蛛吃掉(Drake,2013)。

创建网络

神经网络如何引用它自己?

直接引用(Direct Reference)问题:神经网络通过一组参数 Θ 进行参数化,研究者的目标是构建一个输出为 Θ 本身的网络,这很难直接做到。假设前馈网络的最后一层有 A 输入和 B 输出。线性变换中的权重矩阵的大小是积 AB,当 A> 1 时,它大于 B。

研究者还研究了两种流行的图像生成模型的开源实现:DCGAN(Radford et al.,2016)和 DRAW(Gregor et al.,2015)。二者分别使用 1200 万和 100 万个参数来生成具备 784 个像素的 MNIST 图像。

通常,参数集 Θ 比输出的大小要大得多。为了规避这一点,我们需要一种间接的方式来引用 Θ。

间接引用(Indirect Reference):HyperNEAT(Stanley et al.,2009)是一种神经进化方法,通过用坐标和权重识别每个拓扑连接来描述神经网络。研究者在建立 quine 时采取了同样的策略。研究者没有让 quine 直接输出其权重,而是设置它输入一个坐标(以 one-hot 编码的方式),输出该坐标的权重。

这克服了 Θ 大于输出的问题,因为我们仅对每个坐标 c 输出标量 Θ_c。

Vanilla Quine

研究者将 vanilla quine 定义为一个前馈神经网络,其唯一的工作是输出自身的权重。

图 1:vanilla quine 的结构

假设权重的数量是 A,第一个隐藏层的单元数量是 B,那么投影矩阵的大小将是积 AB,当 B> 1 时,它大于 A。因此,由于 one-hot 表征,我们不能使投影本身成为网络的参数。因此,研究者决定使用固定的随机投影将坐标的 one-hot 编码和隐藏层连接起来。所有其他连接,即隐藏层之间的连接以及最后一个隐藏层和输出层之间的连接,都是神经网络的可变参数。

Von Neumann 认为一个不平凡的自我复制器必然包含三个组件,这些组件自身不足以成为自我复制器:(1)复制器的描述,(2)可以克隆描述的复制机制,(3)可以将复制机制嵌入复制器本身的机制(Von Neumann & Burks,1966)。在这种情况下,为每个权重分配 one-hot 空间中的一个点的坐标系对应(1);由神经网络计算的函数对应(2);固定随机投影对应(3)。下文将解释研究者选择(1)、(2)、(3)的原因,同时牢记这些选择的替代方案会是未来有趣的研究方向。

图 2:未经 one-hot 编码的 quine 的权重和权重预测 log 标准化图示

辅助 Quine

研究者将辅助 quine(auxiliary quine)定义为一个除了自我复制之外还解决一些辅助任务的 vanilla quine。它负责接收辅助输入并返回辅助输出。

图 3: 辅助 quine 的结构

本论文选择图像分类作为辅助任务。MNIST 数据集(LeCun & Cortes,1998)包含从 0 到 9 手写数字的正方形图像(28×28 像素)。这些图像将作为辅助输入。将从辅助输入到网络的连接作为参数而不是随机投影是可能的,但本文只报告后者的结果。

辅助输出是十个类别的概率分布,其中具有最大概率的类别将被选择为预测分类。用 60000 张图像进行训练,10000 张图像进行测试;不需要验证集,因为本研究并不是试图对分类器的性能进行严格的优化。本研究的主要目的是证明神经网络 quine 的概念,因此 MNIST 是合适的辅助任务(它被认为是现代机器学习算法中的一个简单问题)。

论文:Neural Network Quine

论文链接:https://arxiv.org/abs/1803.05859

摘要:自我复制是生物生命的一个重要方面,而这在人工智能系统中很大程度上被忽视了。本论文介绍如何构建和训练自我复制的神经网络。网络通过学习输出自己的权重来复制自己。该网络使用一个损失函数,可以用基于梯度或非梯度的方法进行优化。我们还描述了一种我们称之为再生(regeneration)的方法,它在没有明确优化的情况下通过向网络注入其自身参数的预测来训练网络。自我复制网络的最佳解决方案是在再生和优化步骤之间交替发现的。最后,我们介绍了一种可以解决 MNIST 图像分类等辅助任务的自我复制神经网络设计。我们观察到网络的图像分类能力与其复制能力之间存在权衡,但训练偏向于以复制为代价增加其在图像分类方面的专业度。这与自然界中观察到的繁殖和其他任务之间的平衡类似。我们认为人工智能的自我复制机制是有用的,因为它带来了通过自然选择持续改进的可能性。

本文为机器之心编译,转载请联系本公众号获得授权。

原文发布于微信公众号 - 机器之心(almosthuman2014)

原文发表时间:2018-04-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Duncan's Blog

Twitter用户数据Profiling

传统的数据摘要包括data exploration/data cleansing/data integration.而之后,data management和bi...

1883
来自专栏数据科学与人工智能

【机器学习】10 种机器学习算法的要点

前言 谷歌董事长施密特曾说过:虽然谷歌的无人驾驶汽车和机器人受到了许多媒体关注,但是这家公司真正的未来在于机器学习,一种让计算机更聪明、更个性化的技术。 也许我...

2487
来自专栏IT派

二十六条深度学习经验,来自蒙特利尔深度学习

【前言】2016年8月初的蒙特利尔深度学习暑期班,由Yoshua Bengio、 Leon Bottou等大神组成的讲师团奉献了10天精彩的讲座,剑桥大学自然语...

3257
来自专栏机器人网

十种深度学习算法要点及代码解析

谷歌董事长施密特曾说过:虽然谷歌的无人驾驶汽车和机器人受到了许多媒体关注,但是这家公司真正的未来在于机器学习,一种让计算机更聪明、更个性化的技术。 也许我们生活...

1.1K7
来自专栏机器学习算法与Python学习

以为GAN只能“炮制假图”?它还有这7种另类用途

最近,AI方案设计师Alexandor Honchar在Medium网站上分享一篇文章。他认为生成对抗网络(GAN)目前在生成图像取得了巨大进展,生成的图像几乎...

1013
来自专栏专知

【QA论文笔记】问答对排序新方法,层次循环编码器与主题聚类结合

2483
来自专栏量子位

以为GAN只能“炮制假图”?它还有这7种另类用途

最近,AI方案设计师Alexandor Honchar在Medium网站上分享一篇文章。他认为生成对抗网络(GAN)目前在生成图像取得了巨大进展,生成的图像几乎...

1232
来自专栏织云平台团队的专栏

【干货分享】AIOps之根因分析

本文将给出基于决策树的智能根因分析方法,针对多维找出导致问题的根因。做数据、搞AI一定要基于具体业务,不可脱离业务谈数据、算法,否则将得不偿失。

1.9K10
来自专栏机器之心

学界 | Facebook 新研究:大批量SGD准确训练ImageNet仅需1小时

选自arXiv 机器之心编译 参与:蒋思源 由于近来互联网数据越来越大,深度学习模型越来越复杂,执行训练的时间也越来长。因此近日 Facebook 提出了一种将...

3487
来自专栏机器学习算法与Python学习

机器学习(5)之决策树ID3及Python实现

关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第二 【Python】:排名第三 【算法】:排名第四 ID3是什么? ID3算法是决策树的...

3035

扫码关注云+社区

领取腾讯云代金券