（2） 智能物种的任务、价值链条。这个任务是一个生物进化的“刚需”。如个体的生存，要解决吃饭和安全问题，而物种的传承需要交配和社会活动。这些基本任务会衍生出大量的其它的“任务”。动物的行为都是被各种任务驱动的。任务代表了价值观和决策函数，这些价值函数很多在进化过程中就已经形成了，包括人脑中发现的各种化学成分的奖惩调制，如多巴胺（快乐）、血清素（痛苦）、乙酰胆碱（焦虑、不确定性）、去甲肾上腺素（新奇、兴奋）等。

有了这个先天的基本条件（设计）后，下一个重要问题：是什么驱动了模型在空间中的运动，也就是学习的过程？

（1） 外来的数据。外部世界通过各种感知信号，传递到人脑，塑造我们的模型。数据来源于观察和实践。观察的数据一般用于学习各种统计模型，这种模型就是某种时间和空间的联合分布，也就是统计的关联与相关性。实践的数据用于学习各种因果模型，将行为与结果联系在一起。因果与统计相关是不同的概念。

（2） 内在的任务。这就是由内在的价值函数驱动的行为、以期达到某种目的。我们的价值函数是在生物进化过程中形成的。因为任务的不同，我们往往对环境中有些变量非常敏感，而对其它一些变量不关心。由此，形成不同的模型。

第五节计算机视觉：从“深”到“暗”Dark, Beyond Deep

图像就是一个像素的二维矩阵，可是我们感知到非常丰富的三维场景、行为的信息；你看的时间越长，理解的也越多。

比如，把水烧开，水温就是一个流态；番茄酱与瓶子的空间位置关系是一个流态，可以被挤出来；还有一些流态是人的生物状态，比如饿、累、喜悦、悲痛；或者社会关系：从一般人，到朋友、再到密友等。人类和动物忙忙碌碌，都是在改变各种流态，以提高我们的价值函数（利益）。

感知的图像往往只占5%，提供一些蛛丝马迹；而后面的95%，包括功能、物理、因果、动机等等是要靠人的想象和推理过程来完成的。

计算机视觉要继续发展，必须发掘这些“dark matter”。把图像中想象的95%的暗物质与图像中可见的5%的蛛丝马迹，结合起来思考，才能到达真正的理解。现在大家都喜欢在自己工作前面加一个Deep，以为这样就算深刻了、深沉了，但其实还是非常肤浅的。不管你多深，不管你卷积神经网络多少层，它只是处理可见的图像表观特征、语音特征，没有跳出那5%，对吧？那些认为深度学习解决了计算机视觉的同学，我说服你了么？如果没有，后面还有更多的内容。

第六节认知推理：走进内心世界

再往里面走一步，就进入人与动物的内心世界Mind，内心世界反映外部世界，同时受到动机任务的影响和扭曲。

（1） Ta看到什么？知道什么？什么时候知道的？这其实是对视觉的历史时间求积分

（2） Ta现在在关注什么？这是当前的正在执行的任务

（3） Ta的意图是什么？后面想干什么？预判未来的目的和动机

（4） Ta喜欢什么？有什么价值函数？

第七节语言通讯：沟通的认知基础

纵观人类语言，中国的象形文字实在了不起。所谓象形文字就完全是“明码通讯”。所以，从生成式模型的角度来看，语言就是视觉，视觉就是语言。

第八节博弈伦理：获取、共享人类的价值观

机器人要与人交流，它必须懂得人类价值观。哲学和经济学里面有一个基本假设，认为一个理性的人（rational agent），他的行为和决策都由利益和价值驱动，总在追求自己的利益最大化。与此对应的是非理性的人。对于理性的人，你通过观察他的行为和选择，就可以反向推理、学习、估算他的价值观。

这个价值观我们把它表达为一个利益函数Utility function，用一个符号U表示。它通常包含两部分：（1）Loss损失函数，或者Reward奖励函数；（2）Cost消费函数。就是说，你做一件事得到多少利益，花费多少成本。我们可以把这个利益函数定义在流态的（fluents）空间里面。我们每次行动，改变某些流态，从而在U定义的空间中向上走，也就是“升值”。由函数U对流态向量F求微分的话，就得到一个“场”。

第九节机器人学：构建大任务平台

我在第四节谈到人工智能研究的认知构架，应该是小数据、大任务范式。机器人就是这么一个大任务的科研平台。它不仅要调度视觉识别、语言交流、认知推理等任务，还要执行大量的行动去改变环境。

第十节机器学习：学习的极限和“停机问题”

当前大家做的机器学习，其实是一个很狭义的定义，不代表整个的学习过程。它就包含三步：

（1）你定义一个损失函数loss function 记作u，代表一个小任务，比如人脸识别，对了就奖励1，错了就是-1。

（2）你选择一个模型，比如一个10-层的神经网络，它带有几亿个参数theta，需要通过数据来拟合。

（3）你拿到大量数据，这里假设有人给你准备了标注的数据，然后就开始拟合参数了。

七种学习模式：

（1）被动统计学习：上面刚刚谈到的、当前最流行的学习模式，用大数据拟合模型。

（2）主动学习：学生可以问老师主动要数据，这个在机器学习里面也流行过。

（3）算法教学：老师主动跟踪学生的进展和能力，然后，设计例子来帮你学。这是成本比较高的、理想的优秀教师的教学方式。

（4）演示学习：这是机器人学科里面常用的，就是手把手叫机器人做动作。一个变种是模仿学习。

（5）感知因果学习：这是我发明的一种，就是通过观察别人行为的因果，而不需要去做实验验证，学习出来的因果模型，这在人类认知中十分普遍。

（6）因果学习：通过动手实验，控制其它变量，而得到更可靠的因果模型，科学实验往往属于这一类。

（7）增强学习：就是去学习决策函数与价值函数的一种方法。

第十一节总结：智能科学 --- 牛顿与达尔文理论体系的统一

说到底，人工智能要变成智能科学，它本质上必将是达尔文与牛顿这两个理论体系的统一。

大数据

人工智能综述

第九节机器人学：构建大任务平台

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

大数据

人工智能综述

第九节 机器人学：构建大任务平台

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

第九节机器人学：构建大任务平台