LeCun:智能的精华在于预测能力!“预测学习”了解一下!

导读:在NIPS 2016大会上,著名研究者LeCun提出了预测学习(predictive learning)概念。在他的讲稿中,将机器学习比喻为“蛋糕”:

强化学习,是蛋糕上的小樱桃:输入数据,输出1个数字,代表对于奖励的预测。

有监督学习,是蛋糕的糖霜:输入数据,输出少量结论,例如图像的分类。

无监督学习,预测学习,是蛋糕的真正本体:输入数据,输出同样量级的预测。

□ 例如:输入部分缺失的图像,输出将图像补充完整后的结果。

□ 例如:输入一段视频,输出对于视频的未来发展的预测,如下图所示。

预测学习很重要,而且可能是通往强人工智能的必经之路。目前深度学习的领军人物Hinton、LeCun、Bengio均在此投入了研究,也许它将带来AI的下一场革命。

在笔者看来,预测学习有几个重要特点:

1. 它需要逻辑,需要常识

例如,在预测视频的发展时,需学会物理定律(如牛顿三定律),学会不同事物的特征(如人体的不同关节的运动方法),学会空间立体的概念(需处理物体的平移,旋转,相互间的遮挡),等等。

在推理和预测过程中,还需要记忆,包括长期和短期记忆。目前研究人员已有办法为网络加入各种记忆模组。

2. 它的数据特别容易获得

首先,它是无监督方法,无需人工标记。其次,网络上已经有浩如烟海的视频,截取出的每个片段都可用于训练。而且我们还可用摄像头轻松生成无穷无尽的新视频,甚至可让AI学会主动控制摄像头。

我们还可使用游戏引擎生成视频画面。

3. 此前我们已看到数据对于深度学习的关键性

在使用海量数据训练后,深度网络有可能会逐渐掌握逻辑和常识,改善它此前在这两方面的缺陷,甚至自动发现物理定律。

“情感神经元”是很好的例证:仅仅是要求网络学会预测,网络就可自动发现深层次的规律。

4. 预测学习也有非常实际的用途

例如,在自动驾驶中,如果能预测其它车辆和行人的行为,就可以改善自动驾驶的性能和安全性。

在LeCun的讲稿中,给出了如下公式:

智能 = 感知 + 预测 + 记忆 + 推理和规划

笔者将其总结为:

记忆过去,感知现在,预测未来

如果与强化学习结合,可得到如下图所示的更完整的架构图。这里智能体的目标是最小化费用,这需要通过对世界建模实现。

目前在预测学习领域已有许多有趣的工作,例如让网络预测游戏环境中物体的下落和碰撞轨迹(PhysNet, https://arxiv.org/abs/1603.01312),如下图所示。

左边是游戏场景。右边上排是实际的下落和碰撞情况。右边下排是网络的预测,其中第1张图像是网络的输入,后续3张图像都是网络的预测。

可见,网络有能力大致预测出方块的运动情况,不过会随着时间的推移而越来越模糊。

这是预测模型中的常见现象,是因为未来有不确定性。如下图所示,未来有多种可能性,我们无法提前判知。

因此,如使用MSE作为拟合目标,网络会无所适从,最终造成图像模糊。

解决方法是引入GAN思想,用判别器网络判断未来的发展是否为真。这样网络可以给出更清晰的预测(虽然预测无法囊括未来的所有发展)。

例子见https://github.com/dyelax/Adversarial_Video_Generation,其中的动画非常有趣,推荐读者打开看一看。例如,对于吃豆人游戏的画面预测,如果不使用GAN,在经过一个岔路口时,由于网络不知道吃豆人会选择哪个路口,因此会在画面中同时显示出吃豆人向上走和向下走的轨迹。

关于作者:彭博,人工智能、量化交易、区块链领域的技术专家,有20年以上的研发经验。 在人工智能与信息科技方面,对深度学习、机器学习、计算机图形学、智能硬件等有较为深入的研究。

本文摘编自《深度卷积网络:原理与实践》,经出版方授权发布。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180529G1TS5200?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券