首页标签强化学习

#强化学习

强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。

英伟达将于2019年ICRA发布新的强化学习研究

GPUS Lady

本周,来自华盛顿西雅图新成立的机器人研究实验室的英伟达(NVIDIA)研究人员展示了一种新的概念强化学习方法,旨在增强在模拟环境中训练的机器人在现实世界中的表...

200

英伟达开发AI系统SimOpt,可将模拟转移到现实任务中

AiTechYun

英伟达人工智能研究人员公开了SimOpt,一个人工智能系统,经过训练可以将模拟工作转移到实际行动中,从而完成一些任务,比如把钉子插进孔里,打开和关上抽屉等。

200

预告 | 普渡大学邓新燕副教授蜂鸟机器人研究即将登上ICRA2019舞台,同步开源蜂鸟模拟环境

AI科技评论

什么东西能像鸟一样飞行,还能像昆虫一样在空中悬停呢?答案就是大家都有所耳闻的蜂鸟。近期,普渡大学机械工程的副教授邓新燕在蜂鸟机器人研究上有了新的进展,雷锋网(公...

4120

清华姚班毕业生马腾宇获ACM博士论文奖荣誉奖

新智元

根据其个人主页,马腾宇的研究兴趣广泛,包括机器学习和算法方面的课题,如非凸优化、深度学习及其理论、强化学习、表示学习、分布式优化、凸松弛、高维统计等。

3310

谷歌的 PlaNet 强化学习网络

AI研习社

与其他机器学习方法相比,深度强化学习因其数据量小而闻名,其学习过程中存在不稳定性(参照 Deepmind关于RL与神经网络的论文),以及性能方面的落后。我们已经...

6330

ICLR论文:让AI学会恐惧

新智元

微软的研究人员正在试图教会计算机什么是“恐惧”。他们在ICLR上发表了一篇论文,提出一种强化学习框架。该框架结合了用于实现特定任务目标的奖励函数,并且还最小化了...

6720

《我的世界》AI大战降临:6000万帧超大数据集已发布,NeurIPS 19向你约战

量子位

顶会NeurIPS 2019,为普天之下的强化学习AI,举办了一场Minecraft大赛,并广邀各路英豪参赛。

5120

2018 ACM博士论文奖公布:伯克利博士获奖,清华姚班马腾宇荣誉提名

机器之心

今日,ACM 公布最佳博士论文奖,来自 UC 伯克利的博士生 Chelsea Finn 凭借论文《Learning to Learn with Gradient...

9040

北大张志华:机器学习就是现代统计学

大数据文摘

另一个发展方向是强化学习,强化学习是什么呢?它利用规则与环境交互或者奖赏,然后形成一个学习优化问题,形成一个优化问题。

6430

什么是解耦表示学习?使用beta-VAE模型探究医疗和金融问题

AI科技大本营

若想了解更多细节,可阅读beta-VAE的论文(https://openreview.net/forum?id=Sy2fzU9gl);也可参考这个视频2中的介绍...

15030

机器学习系统简介

iOSDevLog

强化学习 是完全不同的东西。在这种情况下,学习系统被称为代理,学习通过观察周围的世界(通过某种传感器),执行动作并基于某种奖励(奖励)来评估它们(良好的行动 /...

9450

破解数据孤岛壁垒,三篇论文详细解读联邦学习

AI科技评论

通过近期的三篇论文,微众 AI 团队介绍了联邦学习思路下针对有安全需求的有监督学习、强化学习、决策树的具体方法:安全的联邦迁移学习、联邦强化学习以及 Secur...

10740

DeepMind综述深度强化学习中的快与慢,智能体应该像人一样学习

机器之心

近期的 AI 研究引出了强大的技术,如深度强化学习。深度强化学习将表示学习和奖励驱动的行为结合起来,似乎与心理学和神经科学具备内在的相关性。然而深度强化学习需要...

5820

观点 | 通往通用人工智能的路上,我们少不了无监督学习

AI科技评论

在过去十年中,机器学习在很多领域都取得了前所未有的进展,如图像识别,自动驾驶汽车、和玩复杂游戏如「GO」等。这些成就在很大程度上都是通过采用监督学习和强化学习两...

8420

向前、向后、横着走,双足机器人Cassie,靠深度强化学习学会了走路丨论文

量子位

Agility Robotics的双足机器人Cassie,这个没有上半身的机器人,就靠着深度强化学习学会了更灵活的使用自己身体的唯二器官:左腿,和右腿。

8350

推特800赞,DeepMind强化学习综述:她可以很快,但快从慢中来

量子位

Wang与Duan带领的两项研究,几乎是同时发表。都把这样的原理用在了深度强化学习上,就是元强化学习 (Meta RL) 。

10340

ICLR2019 | 你追踪,我逃跑:一种用于主动视觉跟踪的对抗博弈机制

AI科技评论

主动视觉跟踪(Visual Active Tracking)是指智能体根据视觉观测信息主动控制相机的移动,从而实现对目标物体的跟踪(与目标保持特定距离)。主动视...

6620

人工智能深度学习怎么绕坑

刀刀老高

深度学习作为人工智能领域非常重要的一类技术实现方式,已经是目前大多数以AI为核心研究能力的企业的必修课程了。

6330

策略梯度搜索:不使用搜索树的在线规划和专家迭代 | 技术头条

AI科技大本营

蒙特卡罗树搜索(MCTS)在Go和Hex等游戏中实现最大测试时间性能的价值早已为人所知。最近的研究表明,在许多经典的棋盘类游戏中,通过专家迭代算法将规划方法纳入...

6930

AI「王道」逻辑编程的复兴?清华提出神经逻辑机,已入选ICLR

机器之心

研究者在大量任务上对 NLM 进行了实验,包括关系推理、决策等。此外,研究者还证明使用小规模实例训练的 NLM 可以泛化到大规模实例上。在实验中,Softmax...

7930

扫码关注云+社区