腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

ATYUN订阅号

专栏作者

2069

文章

2033295

阅读量

114

订阅数

从错误中学习的工人机器人

机器人神经网络深度学习人工智能强化学习

利兹大学（University of Leeds）的计算机科学家正在利用人工智能（AI）技术进行自动规划和强化学习，训练机器人在杂乱的空间（如仓库货架或冰箱）找到物体并移动。

2020-02-21

3540

DeepMind新型AI训练技术与大脑的关系

强化学习编程算法

DeepMind前段时间发表了一篇论文，详细阐述了一种新开发的强化学习，有希望解释人类大脑中的奖赏通路是如何运作的。据《新科学家》报道，这种机器学习训练方法被称为“分布强化学习”，其背后的机制似乎合理地解释了大脑神经元是如何释放多巴胺的。

2020-02-20

4480

RoboNet的大规模机器人学习数据集

机器人腾讯云测试服务编程算法强化学习

在过去的十年中，我们已经看到深度学习系统为各种感知和推理问题提供了转化解决方案，例如从识别图像中的对象到识别和翻译人类语音。

2019-12-17

1.3K0

Facebook的HanabiAI取得了最先进的成果

强化学习神经网络深度学习人工智能游戏

Facebook AI 部门表示，它创造了最新的AI，可以在玩纸牌游戏Hanabi时达到最先进的性能。人工智能系统在25分制中的得分为24.61分，而之前的最好的系统得分为23.92分。

2019-12-17

4120

DeepMind的机器学习模型MuZero是如何学会下棋的

游戏 go 强化学习

DeepMind在去年年底发表在《科学》杂志上的一篇论文中，详细介绍了AlphaZero，这是一种人工智能系统，可以自学如何掌握国际象棋、日本象棋“将棋”的变体以及中国的围棋。在这些棋种的竞赛中，AlphaZero都成功击败了世界冠军。

2019-11-28

8900

AI“贝多芬”诞生了？

深度学习神经网络人工智能强化学习

音乐是艺术，音乐也是一门生意。如今，音乐这门生意越发引起商业巨头的关注。曾经，各音乐平台比的是曲目数量，艺人进驻数量，后来则更看重独家版权。现在，以深度神经网络为代表的AI技术逐渐逼近落地，放眼全球，音乐平台的AI大战一触即发。

2019-10-15

6240

DeepMind的人工智能系统学会了绘画

强化学习监督学习神经网络深度学习人工智能

近日，在伦敦举行的深度学习峰会会议上，DeepMind研究科学家Ali Eslami提出了一个非常有趣的项目，名为“人工智能和创造力”。

2019-10-15

7410

DeepMind已经悄悄地开放了三个令人印象深刻的强化学习框架

强化学习游戏神经网络人工智能编程算法

近年来，深度强化学习(DRL)一直是人工智能(AI)一些重大突破的核心。然而，尽管DRL方法取得了很大的进步，但由于缺少工具和库，它仍然难以应用于主流解决方案中。因此，DRL在很大程度上仍然是一种研究活动，并没有在现实世界中大量采用机器学习解决方案。解决这个问题需要更好的工具和框架。在当前一代人工智能(AI)领导者中，DeepMind是唯一一家在推进DRL研发方面做得最多的公司。最近，Alphabet子公司发布了一系列新的开源技术，可以帮助简化DRL方法的采用。

2019-10-14

4040

解近似策略优化(PPO)及其马里奥游戏环境实战

强化学习编程算法

文中蓝色字体为链接，部分外部链接无法从文章内部直接访问，请点击文末阅读原文以访问链接。

2019-08-23

1.7K0

优步公开轻量级库EvoGrad：基于梯度的进化算法

编程算法 python 机器学习强化学习 pytorch

可实现快速灵活实验的工具会实现民主化并加速机器学习研究。例如，开发用于自动区分的库，Theano，Caffe，TensorFlow和PyTorch，有助于催化机器学习研究，实现梯度下降训练，而避免手动计算带来的繁琐工作。

2019-07-30

8580

AI系统帮助无人机像直升机一样悬停，像飞机一样飞行

强化学习腾讯云测试服务

无人机可以将食物运送到高尔夫球场，对消防员和急救人员进行侦察，并在奥运会开幕式上进行灯光秀。但它们的螺旋桨前倾形式并不完全有利于动力效率，这限制了它们的飞行时间。

2019-07-22

4800

一分钟复制经典艺术画作！Adobe开发机器学习系统LPaintB

强化学习编程算法

算法在绘画，素描和雕刻方面具有人性化的精确度。马里兰大学和Adobe研究所的研究人员开发了一种新的机器学习系统LPaintB，它可以在不到一分钟的时间内，重现达芬奇，梵高和维米尔风格的画。

2019-07-05

5120

Facebook开发AI Habitat帮助机器人在现实环境中导航

机器人神经网络深度学习人工智能强化学习

Facebook AI推出了AI Habitat，这是一款可以训练AI智能体的模拟器，让它可以像家庭机器人一样在典型模拟环境（如公寓或办公室等）中运行。

2019-06-18

6720

英伟达开发AI系统SimOpt，可将模拟转移到现实任务中

机器人强化学习编程算法神经网络深度学习

英伟达人工智能研究人员公开了SimOpt，一个人工智能系统，经过训练可以将模拟工作转移到实际行动中，从而完成一些任务，比如把钉子插进孔里，打开和关上抽屉等。

2019-05-21

4290

用于组合优化的强化学习：学习策略解决复杂的优化问题

编程算法神经网络强化学习

从人类诞生之初，每一项技术创新，每一项改善我们生活的发明都是经过奇思妙想后设计出来的。从火到车轮，从电力到量子力学，我们对世界的理解和我们周围事物的复杂性，已经增长到难以直观地掌握它们的程度。

2019-05-13

2.7K0

谷歌开源PlaNet，一个通过图像了解世界的强化学习技术

强化学习机器人

通过强化学习，研究AI如何随着时间的推移提高决策能力的研究进展迅速。对于这种技术，智能体在选择动作（如运动命令）时观察一系列感官输入（如相机图像），有时会因为达到指定目标而获得奖励。

2019-03-13

5190

一文全面了解反向强化学习

反向强化学习（IRL）是近年来发展起来的一种能够解决RL反向问题的机器学习框架。简而言之，IRL就是向人类学习，它通过观察个体的行为来学习其目标、价值或奖励的领域。

2019-01-09

2.1K0

2018年11月机器学习Github开源项目TOP 10

强化学习深度学习

在此期间，我们将项目与新的或主要版本进行了比较。Mybridge AI根据各种因素对项目进行排名，以衡量专业人员的质量。

2018-12-24

5190

DeepMind最新论文：探索智能体对齐，使AI用符合用户意图的方式解决问题

DeepMind发布了新论文，概述了解决智能体对齐问题的研究方向。我们的方法依赖于奖励建模的递归应用，以符合用户意图的方式解决复杂的现实问题。

2018-12-18

5750

OpenAI和DeepMind的AI智能体在两个Atari游戏中表现优于人类

强化学习神经网络

通过观看人类来学习玩游戏的智能体研究又有了新进展。OpenAI和DeepMind在发表的一篇论文“Reward learning from human preferences and demonstrations in Atari”中，描述了一种AI系统，该系统结合了从两种人类反馈中学习的方法：专家演示和轨迹偏好。

2018-12-18

5880

点击加载更多

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态