机器之心

3029 篇文章
120 人订阅

强化学习

机器之心

ICML 2019 | 强化学习用于推荐系统,蚂蚁金服提出生成对抗用户模型

作者:Xinshi Chen、Shuang Li、Hui Li、Shaohua Jiang、Yuan Qi、Le Song

1171
机器之心

DeepMind游戏AI登上Science:雷神之锤多智能体合作,超越人类玩家

没有什么游戏的操作原理比夺旗更简单的了(除了抓人或踢罐子游戏)。两队各自在己方的基地中设有标记物,然后争夺对方的标记物并将其安全送回基地。这太简单了!

1092
机器之心

2018 ACM博士论文奖公布:伯克利博士获奖,清华姚班马腾宇荣誉提名

今日,ACM 公布最佳博士论文奖,来自 UC 伯克利的博士生 Chelsea Finn 凭借论文《Learning to Learn with Gradient...

1044
机器之心

DeepMind综述深度强化学习中的快与慢,智能体应该像人一样学习

DeepMind 研究者近期在 Trends In Cognitive Sciences 期刊上发表文章,概览了深度强化学习中的一些新技术,这些技术旨在弥补强化...

672
机器之心

AI「王道」逻辑编程的复兴?清华提出神经逻辑机,已入选ICLR

这篇论文被接受为 ICLR 2019 的 Poster,它的评分为 6、5、7。正如评审该论文的领域主席所言,这篇论文提出了一个非常有意思的正向链模型,它利用了...

813
机器之心

ICLR 2019论文解读:深度学习应用于复杂系统控制

20 世纪,控制论、系统论、信息论,对工业产生了颠覆性的影响。继 2011 年深度学习在物体检测上超越传统方法以来,深度学习在识别传感(包含语音识别、物体识别)...

1604
机器之心

另一种可微架构搜索:商汤提出在反传中学习架构参数的SNAS

作者:Sirui Xie、Hehui Zheng、Chunxiao Liu、Liang Lin

814
机器之心

如何在TensorFlow 2.0中构建强化学习智能体

对此,Keras 提出者、谷歌科学家 François Chollet 表示,这是一份非常详尽的介绍。

1002
机器之心

真的超越了波士顿动力!深度强化学习打造的 ANYmal 登上 Science 子刊

摘要:足式机器人是机器人学中最具挑战性的主题之一。动物动态、敏捷的动作是无法用现有人为方法模仿的。一种引人注目的方法是强化学习,它只需要极少的手工设计,能够促进...

612
机器之心

用AI设计微波集成电路,清华大学等提出深度强化学习方法RINN

微波集成电路(MWIC)是人类智慧、经验和直觉碰撞的产物。工程师使用计算机辅助设计工具来分析和解决 MWIC 问题,然后试图寻找最佳解决方案。这一过程非常枯燥、...

521
机器之心

百页课程笔记,统计物理视角下的深度学习

近日,哥德堡大学物理系 Bernhard Mehlig 教授在 arXiv 上发布了他的一本「新书」《Artifical Neural Networks》。这本...

1052
机器之心

深度学习局限何在?图网络的出现并非偶然

本文作者 M. Mitchell Waldrop 是威斯康星大学基本粒子物理学博士,曾担任 Nature、Science 等顶级期刊撰稿人、编辑,出版过《复杂》...

762
机器之心

新的一年,DeepMind准备让AI学会「放烟花」

近日,DeepMind 与 Google Brain 团队合作发布了 Hanabi 学习环境(HLE)的代码和论文,这是一个基于流行纸牌游戏的多智能体学习和即时...

1093
机器之心

谷歌最新验证系统又双叒被「破解」了,这次是强化学习

对于谷歌浏览器的用户来说,上面这幅画面想必并不陌生。这是谷歌开发的验证码系统 reCaptcha,旨在确认访问者是人还是程序,并防止恶意程序的入侵。

981
机器之心

仅需2小时学习,基于模型的强化学习方法可以在Atari上实现人类水平

无模型强化学习(RL)能够用于学习复杂任务(如雅达利游戏)的有效策略。但这通常需要非常大量的交互——事实上,比人类掌握相同游戏需要的尝试多多了。为什么人类可以学...

1464
机器之心

CVPR 2019审稿排名第一满分论文:让机器人也能「问路」的视觉语言导航新方法

来源:UC Santa Barbara 计算机科学系助理教授王威廉微博。因 CVPR 2019 论文评审并非 open review,得分以及排名无法确认。

1482
机器之心

让智能体主动交互,DeepMind提出用元强化学习实现因果推理

发现和利用环境中的因果结构是智能体面临的一大关键挑战。这里我们探索了是否可通过元强化学习来实现因果推理(cause reasoning)。我们使用无模型强化学习...

914
机器之心

「全民体验」AlphaZero:FAIR田渊栋首次开源超级围棋AI

对于有计算机基础的围棋爱好者来说,你也可以下载 ELF OpenGo 最终版本模型进行编译,体验与超越人类顶尖水平的 AI 围棋对战了(这需要你的电脑里有支持英...

1014
机器之心

Science:人工智能的发展离不开神经科学,先天结构或是下一个方向

数学家阿兰·图灵 1950 年的开创性论文引领了人类对人工智能(AI)的探索,他在这篇论文中提出了一个问题:「机器能否思考?」,那时候唯一已知的能够进行复杂计算...

712
机器之心

AI领域为何缺乏突破?前Quora工程VP:Hinton没有说到点子上

2017 年可能是散播 AI 恐惧和 AI 炒作的一年,而 2018 年这些「宣传」开始降温。尽管一些大人物继续发表关于 AI 恐惧的言论,但他们或许太忙了,没...

1012

扫码关注云+社区

领取腾讯云代金券