首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

击败水哥还不算最强,有个人工智能已经通过人类的智商测试了

这几天百度的人工智能在《最强大脑》击败“水哥”王昱珩,再次引发了人们对于人工智能的热议。然而人工智能在人脸识别的比赛中击败水哥,还远远称不上“最强大脑”,因为模式识别只是人工智能的第一步。下一步,是像人一样观察和理解这个世界。 今天『量子位』就讲一个科学家进一步缩短计算机和人脑之间鸿沟的故事。不过,在继续之前,先考一考大家,下面这道题答案是什么?我们放在最后揭晓。 我们先来说正经事儿。 最近,美国西北大学的一个团队研发了一个新的人工智能计算模型,这套系统在智商测试中,已经表现出人类的水准。这项工作的

010

让智能体主动交互,DeepMind提出用元强化学习实现因果推理

发现和利用环境中的因果结构是智能体面临的一大关键挑战。这里我们探索了是否可通过元强化学习来实现因果推理(cause reasoning)。我们使用无模型强化学习训练了一个循环网络来求解一系列包含因果结构的问题。我们发现,训练后的智能体能够在全新的场景中执行因果推理,从而获得奖励。智能体可以选择信息干预、根据观察数据得出因果推论以及做出反事实的预测。尽管也存在已有的形式因果推理算法,但我们在这篇论文中表明这样的推理可以由无模型强化学习产生,并提出这里给出的更多端到端的基于学习的方法也许有助于在复杂环境中的因果推理。通过让智能体具备执行——以及解释——实验的能力,本研究也能为强化学习中的结构化探索提供新的策略。

04
领券