专栏首页华章科技LeCun:智能的精华在于预测能力!“预测学习”了解一下!

LeCun:智能的精华在于预测能力!“预测学习”了解一下!

导读:在NIPS 2016大会上,著名研究者LeCun提出了预测学习(predictive learning)概念。在他的讲稿中,将机器学习比喻为“蛋糕”:

  • 强化学习,是蛋糕上的小樱桃:输入数据,输出1个数字,代表对于奖励的预测。
  • 有监督学习,是蛋糕的糖霜:输入数据,输出少量结论,例如图像的分类。
  • 无监督学习,预测学习,是蛋糕的真正本体:输入数据,输出同样量级的预测。 □ 例如:输入部分缺失的图像,输出将图像补充完整后的结果。 □ 例如:输入一段视频,输出对于视频的未来发展的预测,如下图所示。

预测学习很重要,而且可能是通往强人工智能的必经之路。目前深度学习的领军人物Hinton、LeCun、Bengio均在此投入了研究,也许它将带来AI的下一场革命。

在笔者看来,预测学习有几个重要特点:

1. 它需要逻辑,需要常识

例如,在预测视频的发展时,需学会物理定律(如牛顿三定律),学会不同事物的特征(如人体的不同关节的运动方法),学会空间立体的概念(需处理物体的平移,旋转,相互间的遮挡),等等。

  • 在推理和预测过程中,还需要记忆,包括长期和短期记忆。目前研究人员已有办法为网络加入各种记忆模组。

2. 它的数据特别容易获得

首先,它是无监督方法,无需人工标记。其次,网络上已经有浩如烟海的视频,截取出的每个片段都可用于训练。而且我们还可用摄像头轻松生成无穷无尽的新视频,甚至可让AI学会主动控制摄像头。

  • 我们还可使用游戏引擎生成视频画面。

3. 此前我们已看到数据对于深度学习的关键性

在使用海量数据训练后,深度网络有可能会逐渐掌握逻辑和常识,改善它此前在这两方面的缺陷,甚至自动发现物理定律。

  • “情感神经元”是很好的例证:仅仅是要求网络学会预测,网络就可自动发现深层次的规律。

4. 预测学习也有非常实际的用途

例如,在自动驾驶中,如果能预测其它车辆和行人的行为,就可以改善自动驾驶的性能和安全性。

在LeCun的讲稿中,给出了如下公式:

智能 = 感知 + 预测 + 记忆 + 推理和规划

笔者将其总结为:

记忆过去,感知现在,预测未来

如果与强化学习结合,可得到如下图所示的更完整的架构图。这里智能体的目标是最小化费用,这需要通过对世界建模实现。

目前在预测学习领域已有许多有趣的工作,例如让网络预测游戏环境中物体的下落和碰撞轨迹(PhysNet, https://arxiv.org/abs/1603.01312),如下图所示。

左边是游戏场景。右边上排是实际的下落和碰撞情况。右边下排是网络的预测,其中第1张图像是网络的输入,后续3张图像都是网络的预测。

可见,网络有能力大致预测出方块的运动情况,不过会随着时间的推移而越来越模糊。

这是预测模型中的常见现象,是因为未来有不确定性。如下图所示,未来有多种可能性,我们无法提前判知。

因此,如使用MSE作为拟合目标,网络会无所适从,最终造成图像模糊。

解决方法是引入GAN思想,用判别器网络判断未来的发展是否为真。这样网络可以给出更清晰的预测(虽然预测无法囊括未来的所有发展)。

例子见https://github.com/dyelax/Adversarial_Video_Generation,其中的动画非常有趣,推荐读者打开看一看。例如,对于吃豆人游戏的画面预测,如果不使用GAN,在经过一个岔路口时,由于网络不知道吃豆人会选择哪个路口,因此会在画面中同时显示出吃豆人向上走和向下走的轨迹。

关于作者:彭博,人工智能、量化交易、区块链领域的技术专家,有20年以上的研发经验。 在人工智能与信息科技方面,对深度学习、机器学习、计算机图形学、智能硬件等有较为深入的研究。

本文摘编自《深度卷积网络:原理与实践》,经出版方授权发布。

延伸阅读《深度卷积网络:原理与实践》

转载请联系微信:togo-maruko

点击文末右下角“写留言”发表你的观点

推荐语:20年开发经验专家/知乎大V,从技术理论、工作原理、实践方法等方面系统、深入讲解DCNN。

本文分享自微信公众号 - 大数据(hzdashuju),作者:彭博

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-05-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 大数据时代的网络分析,如何全盘挖掘大数据?

    我们生活在一个互联实体(entities)构成的复杂世界中。人类涉足的所有领域,从生物学到医学、经济学和气候科学,都充满了大规模数据集。

    华章科技
  • 干货丨3分钟了解今日头条推荐算法原理

    今日头条的内容分发算法一直颇神秘低调。自12年开发运营起进四次改版,从未透露核心内容。

    华章科技
  • 普通程序员如何转向AI方向?

    本文的目的是给出一个简单的,平滑的,易于实现的学习方法,帮助 “普通” 程序员踏入AI领域这个门。这里,我对普通程序员的定义是:拥有大学本科知识;平时工作较忙;...

    华章科技
  • Richard S. Sutton经典图书:《强化学习导论》第二版(附PDF下载)

    【导读】Richard S. Sutton就职于iCORE大学计算机科学系,是强化学习领域的专家,其在强化学习领域的著作“Reinforcement Learn...

    WZEARW
  • 深入理解并发/并行,阻塞/非阻塞,同步/异步

    版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/sinat_35512245/articl...

    大黄大黄大黄
  • 共轭梯度法解线性方程组

    共轭梯度法是方程组求解的一种迭代方法。这种方法特别适合有限元求解,因为该方法要求系数矩阵为对称正定矩阵,而有限元平衡方程的系数矩阵正好是对称正定矩阵(考虑边界条...

    fem178
  • 中信证券:金融科技公司盈利模式和估值逻辑

    点滴科技资讯
  • bootstrap select js操作

    组件赋值就需要稍微变换一下了,如果你直接 $('#sel').val('1'); 这样赋值将会无效,正确的赋值方法为:

    用户5760343
  • 普林斯顿大学教授:用理论的力量横扫深度学习(77PPT)

    【新智元导读】目前深度学习的应用较为广泛,尤其是各种开源库的使用,导致很多从业人员只注重应用的开发,却往往忽略了对理论的深究与理解。普林斯顿大学教授Sanjee...

    新智元
  • Echarts图表结合webgl可视化平台进行数据对接

    使用Echarts图表结合webgl可视化平台进行数据对接,3D物联网开发选哪个?前端人员能不能跑来搞3D可视化开发?用什么可以简单快速建模?开发中遇到问题不知...

    要不要吃火锅

扫码关注云+社区

领取腾讯云代金券