首页
学习
活动
专区
工具
TVP
发布

ATYUN订阅号

专栏作者
2069
文章
2033295
阅读量
114
订阅数
从错误中学习的工人机器人
利兹大学(University of Leeds)的计算机科学家正在利用人工智能(AI)技术进行自动规划和强化学习,训练机器人在杂乱的空间(如仓库货架或冰箱)找到物体并移动。
AiTechYun
2020-02-21
3540
DeepMind新型AI训练技术与大脑的关系
DeepMind前段时间发表了一篇论文,详细阐述了一种新开发的强化学习,有希望解释人类大脑中的奖赏通路是如何运作的。据《新科学家》报道,这种机器学习训练方法被称为“分布强化学习”,其背后的机制似乎合理地解释了大脑神经元是如何释放多巴胺的。
AiTechYun
2020-02-20
4480
RoboNet的大规模机器人学习数据集
在过去的十年中,我们已经看到深度学习系统为各种感知和推理问题提供了转化解决方案,例如从识别图像中的对象到识别和翻译人类语音。
AiTechYun
2019-12-17
1.3K0
Facebook的HanabiAI取得了最先进的成果
Facebook AI 部门表示,它创造了最新的AI,可以在玩纸牌游戏Hanabi时达到最先进的性能。人工智能系统在25分制中的得分为24.61分,而之前的最好的系统得分为23.92分。
AiTechYun
2019-12-17
4120
DeepMind的机器学习模型MuZero是如何学会下棋的
DeepMind在去年年底发表在《科学》杂志上的一篇论文中,详细介绍了AlphaZero,这是一种人工智能系统,可以自学如何掌握国际象棋、日本象棋“将棋”的变体以及中国的围棋。在这些棋种的竞赛中,AlphaZero都成功击败了世界冠军。
AiTechYun
2019-11-28
8900
AI“贝多芬”诞生了?
音乐是艺术,音乐也是一门生意。如今,音乐这门生意越发引起商业巨头的关注。曾经,各音乐平台比的是曲目数量,艺人进驻数量,后来则更看重独家版权。现在,以深度神经网络为代表的AI技术逐渐逼近落地,放眼全球,音乐平台的AI大战一触即发。
AiTechYun
2019-10-15
6240
DeepMind的人工智能系统学会了绘画
近日,在伦敦举行的深度学习峰会会议上,DeepMind研究科学家Ali Eslami提出了一个非常有趣的项目,名为“人工智能和创造力”。
AiTechYun
2019-10-15
7410
DeepMind已经悄悄地开放了三个令人印象深刻的强化学习框架
近年来,深度强化学习(DRL)一直是人工智能(AI)一些重大突破的核心。然而,尽管DRL方法取得了很大的进步,但由于缺少工具和库,它仍然难以应用于主流解决方案中。因此,DRL在很大程度上仍然是一种研究活动,并没有在现实世界中大量采用机器学习解决方案。解决这个问题需要更好的工具和框架。在当前一代人工智能(AI)领导者中,DeepMind是唯一一家在推进DRL研发方面做得最多的公司。最近,Alphabet子公司发布了一系列新的开源技术,可以帮助简化DRL方法的采用。
AiTechYun
2019-10-14
4040
解近似策略优化(PPO)及其马里奥游戏环境实战
文中蓝色字体为链接,部分外部链接无法从文章内部直接访问,请点击文末阅读原文以访问链接。
AiTechYun
2019-08-23
1.7K0
优步公开轻量级库EvoGrad:基于梯度的进化算法
可实现快速灵活实验的工具会实现民主化并加速机器学习研究。例如,开发用于自动区分的库,Theano,Caffe,TensorFlow和PyTorch,有助于催化机器学习研究,实现梯度下降训练,而避免手动计算带来的繁琐工作。
AiTechYun
2019-07-30
8580
AI系统帮助无人机像直升机一样悬停,像飞机一样飞行
无人机可以将食物运送到高尔夫球场,对消防员和急救人员进行侦察,并在奥运会开幕式上进行灯光秀。但它们的螺旋桨前倾形式并不完全有利于动力效率,这限制了它们的飞行时间。
AiTechYun
2019-07-22
4800
一分钟复制经典艺术画作!Adobe开发机器学习系统LPaintB
算法在绘画,素描和雕刻方面具有人性化的精确度。马里兰大学和Adobe研究所的研究人员开发了一种新的机器学习系统LPaintB,它可以在不到一分钟的时间内,重现达芬奇,梵高和维米尔风格的画。
AiTechYun
2019-07-05
5120
Facebook开发AI Habitat帮助机器人在现实环境中导航
Facebook AI推出了AI Habitat,这是一款可以训练AI智能体的模拟器,让它可以像家庭机器人一样在典型模拟环境(如公寓或办公室等)中运行。
AiTechYun
2019-06-18
6720
英伟达开发AI系统SimOpt,可将模拟转移到现实任务中
英伟达人工智能研究人员公开了SimOpt,一个人工智能系统,经过训练可以将模拟工作转移到实际行动中,从而完成一些任务,比如把钉子插进孔里,打开和关上抽屉等。
AiTechYun
2019-05-21
4290
用于组合优化的强化学习:学习策略解决复杂的优化问题
从人类诞生之初,每一项技术创新,每一项改善我们生活的发明都是经过奇思妙想后设计出来的。从火到车轮,从电力到量子力学,我们对世界的理解和我们周围事物的复杂性,已经增长到难以直观地掌握它们的程度。
AiTechYun
2019-05-13
2.7K0
谷歌开源PlaNet,一个通过图像了解世界的强化学习技术
通过强化学习,研究AI如何随着时间的推移提高决策能力的研究进展迅速。对于这种技术,智能体在选择动作(如运动命令)时观察一系列感官输入(如相机图像),有时会因为达到指定目标而获得奖励。
AiTechYun
2019-03-13
5190
一文全面了解反向强化学习
反向强化学习(IRL)是近年来发展起来的一种能够解决RL反向问题的机器学习框架。简而言之,IRL就是向人类学习,它通过观察个体的行为来学习其目标、价值或奖励的领域。
AiTechYun
2019-01-09
2.1K0
2018年11月机器学习Github开源项目TOP 10
在此期间,我们将项目与新的或主要版本进行了比较。Mybridge AI根据各种因素对项目进行排名,以衡量专业人员的质量。
AiTechYun
2018-12-24
5190
DeepMind最新论文:探索智能体对齐,使AI用符合用户意图的方式解决问题
DeepMind发布了新论文,概述了解决智能体对齐问题的研究方向。我们的方法依赖于奖励建模的递归应用,以符合用户意图的方式解决复杂的现实问题。
AiTechYun
2018-12-18
5750
OpenAI和DeepMind的AI智能体在两个Atari游戏中表现优于人类
通过观看人类来学习玩游戏的智能体研究又有了新进展。OpenAI和DeepMind在发表的一篇论文“Reward learning from human preferences and demonstrations in Atari”中,描述了一种AI系统,该系统结合了从两种人类反馈中学习的方法:专家演示和轨迹偏好。
AiTechYun
2018-12-18
5880
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档