ATYUN订阅号

1653 篇文章
85 人订阅

强化学习

AiTechYun

Facebook开发AI Habitat帮助机器人在现实环境中导航

Facebook AI推出了AI Habitat,这是一款可以训练AI智能体的模拟器,让它可以像家庭机器人一样在典型模拟环境(如公寓或办公室等)中运行。

842
AiTechYun

英伟达开发AI系统SimOpt,可将模拟转移到现实任务中

英伟达人工智能研究人员公开了SimOpt,一个人工智能系统,经过训练可以将模拟工作转移到实际行动中,从而完成一些任务,比如把钉子插进孔里,打开和关上抽屉等。

771
AiTechYun

用于组合优化的强化学习:学习策略解决复杂的优化问题

从人类诞生之初,每一项技术创新,每一项改善我们生活的发明都是经过奇思妙想后设计出来的。从火到车轮,从电力到量子力学,我们对世界的理解和我们周围事物的复杂性,已经...

1265
AiTechYun

谷歌开源PlaNet,一个通过图像了解世界的强化学习技术

通过强化学习,研究AI如何随着时间的推移提高决策能力的研究进展迅速。对于这种技术,智能体在选择动作(如运动命令)时观察一系列感官输入(如相机图像),有时会因为达...

1023
AiTechYun

一文全面了解反向强化学习

反向强化学习(IRL)是近年来发展起来的一种能够解决RL反向问题的机器学习框架。简而言之,IRL就是向人类学习,它通过观察个体的行为来学习其目标、价值或奖励的领...

2623
AiTechYun

2018年11月机器学习Github开源项目TOP 10

在此期间,我们将项目与新的或主要版本进行了比较。Mybridge AI根据各种因素对项目进行排名,以衡量专业人员的质量。

1063
AiTechYun

DeepMind最新论文:探索智能体对齐,使AI用符合用户意图的方式解决问题

DeepMind发布了新论文,概述了解决智能体对齐问题的研究方向。我们的方法依赖于奖励建模的递归应用,以符合用户意图的方式解决复杂的现实问题。

902
AiTechYun

OpenAI和DeepMind的AI智能体在两个Atari游戏中表现优于人类

通过观看人类来学习玩游戏的智能体研究又有了新进展。OpenAI和DeepMind在发表的一篇论文“Reward learning from human pref...

1173
AiTechYun

Facebook开源强化学习平台Horizon,可大规模部署AI

Facebook开源了Horizon,这是一个由Facebook AI研究人员,推荐系统专家和工程师创建的强化学习平台。

1251
AiTechYun

强化学习开源项目:自己动手创建虚拟自动驾驶汽车

想象一下,你生活在一个没有交通拥堵,没有交通事故,也无需花费时间开车的世界,那会多美好。

4362
AiTechYun

2018年10月机器学习Github开源项目TOP 10

在过去的一个月里,我们(Mybridge)将近250个机器学习开源项目排名,选出前10位。

1754
AiTechYun

谷歌推出开源的ActiveQA,一个学习如何问好问题的AI

AI系统自然不善于提问,人们必须教导它们。这是Google关注的核心领域,它利用自然语言处理和其他会话AI技术,使与Google智能助理的互动尽可能自然。

1284
AiTechYun

谷歌推出开源强化学习框架Dopamine

强化学习研究在过去几年取得了许多重大进展。这些进步使得智能体以超越人类的级别玩游戏,值得注意的例子包括DeepMind的DQN玩Atari游戏,AlphaGo,...

1933
AiTechYun

AI算法从零开始设计药物分子,可加速新药物的设计

北卡罗来纳大学开发新的AI算法,可以教会它从头开始设计新的药物分子,并有可能大大加速新药物的设计。

712
AiTechYun

剑桥大学研究人员首次使用强化学习训练AI自动驾驶

剑桥大学工程师们用15到20分钟教会了AI有关驾驶的基本知识,而这个过程可能会让人类花费几十个小时。

1302
AiTechYun

微软收购公司Bonsai,提升微软在AI领域竞争力

Bonsai是位于加利福尼亚州伯克利的一家人工智能创业公司,旨在通过使业务决策者可以访问该技术来实现AI的民主化,它正在将强化学习所涉及的复杂性抽象化。

812
AiTechYun

Berkeley用TMD策略制定计划,实现骑行任务

如果你打算从UC Berkeley骑行到金门大桥(Golden Gate Bridge),这样骑行20英里也不错,但问题是,你从没骑过自行车!更棘手的是,你初来...

1154
AiTechYun

DeepMind用基于AI的元强化学习框架研究多巴胺在学习过程中的作用

最近,AI已经应用到一系列视频游戏中,如Atari经典的Breakout和Pong。尽管这样的表现令人印象深刻,但人工智能仍然依靠数千小时的游戏时间来达到并超越...

1265
AiTechYun

伯克利人工智能研究:基于模型的强化学习与神经网络动力学

让机器人在现实世界中自主行动是很困难的。即使拥有昂贵的机器人和世界级的研究人员,机器人在复杂的、非结构化的环境中仍然难以自主导航和交互。 ? ? 图1:一个学习...

3705
AiTechYun

【学术】强化学习系列(上):关于强化学习,你需要知道的重要知识点

强化学习是一个非常有用的工具,可以在任何机器学习工具包中使用。为了能使你能够尽可能快地实现最新的模型,本系列的两篇文章是作为基础知识来设计的。这两篇文章中将分享...

3768

扫码关注云+社区

领取腾讯云代金券