量子位

3291 篇文章
96 人订阅

强化学习

量子位

ICML 2019全纪录:论文解读、workshop讨论、核心知识都在这里了

这份笔记来自布朗大学博士David Abel,他整理了6月10日-6月14日五天ICML会议的精华内容,包含大牛发言、重要的定义公式、重点PPT,还有学术会议中...

1152
量子位

谷歌造了个虚拟足球场,让AI像打FIFA一样做强化学习训练丨开源有API

今天,谷歌开源了足球模拟环境Google Research Football,智能体可以在这个宛若FIFA的世界里自由踢球,学到更多踢球技巧。

662
量子位

《我的世界》AI大战降临:6000万帧超大数据集已发布,NeurIPS 19向你约战

顶会NeurIPS 2019,为普天之下的强化学习AI,举办了一场Minecraft大赛,并广邀各路英豪参赛。

622
量子位

向前、向后、横着走,双足机器人Cassie,靠深度强化学习学会了走路丨论文

Agility Robotics的双足机器人Cassie,这个没有上半身的机器人,就靠着深度强化学习学会了更灵活的使用自己身体的唯二器官:左腿,和右腿。

945
量子位

推特800赞,DeepMind强化学习综述:她可以很快,但快从慢中来

强化学习 (RL) 太慢。人类一两盘就能学会的游戏,AI可能要和游戏环境互动上亿次才能解锁。样本效率低,模拟不出人类学习的过程。

1064
量子位

DeepMind深度学习高级课程,视频已全部放出

课号COMPGI22,名叫高级深度学习和强化学习 (Advanced Deep Learning and Reinforcement Learning) ,是今...

1052
量子位

DeepMind和Unity合作,创建虚拟世界来训练AI

下围棋、打《星际2》、吃豆豆,DeepMind一直很爱“玩游戏”,现在,他们要把AI扔到更沉浸的游戏世界里了。

1072
量子位

MIT深度学习课堂开课啦,自动驾驶圈大牛排队来讲课丨资源

1月份的课程表已经安排上了,在四个星期的时间内,将会有6.S094自动驾驶的深度学习技术、6.S091深度强化学习、6.S093以人为本的人工智能三门课,MIT...

1172
量子位

下个目标是攻克FIFA游戏?DeepMind让AI自学传球配合

今天,这家英国的AI公司开源了机器人足球模拟环境MuJoCo Soccer,实现了对2v2足球赛的模拟。

873
量子位

从俄罗斯方块到星际2,全都用得上:DeepMind无监督分割大法,为游戏而生

这段表演,来自DeepMind最新发布的神经网络MONet (简称“莫奈”) 。

754
量子位

斯坦福2019强化学习课程完结,讲义、PPT、视频已提供下载

斯坦福大学AI课程资源接二连三开始更新。上周NLP课程才结束,这周强化学习(RL)课程也已全部完结。

891
量子位

伯克利机械臂灵巧如人手:叠得齐毛巾,夹得起钉子,重点是不贵

机器人的名字叫Blue,出生在加州伯克利,Pieter Abbeel的强化学习实验室。

572
量子位

用C++实现强化学习,速度不亚于Python,这里有个框架可用

一位名叫Isaac Poulton的英国小哥,开源了一个名为CppRL的C++强化学习框架。

1112
量子位

2018年ML/AI重大进展有哪些?LeCun推荐了这篇回答

刚刚,前Quora技术VP、AI领域技术专家Xavier Amatriain在Quora上回答了一个相关的问题:2018年ML/AI领域最重要的进展是什么?

1223
量子位

受婴儿抓阄启发,谷歌让机器臂自学抓取物体,不用标注数据

谷歌大脑让AI更像儿童了,至少在对象识别和感知方面是这样。最近,他们和加州大学伯克利分校的学生研究了一种算法Grasp2Vec,通过观察和操纵来“学习”物体的特...

843
量子位

亚马逊自动驾驶小车上线啦:才卖1700元,请叫它“强化学习玩具”

亚马逊的自动驾驶汽车DeepRacer上线啦,不过你并不能坐进去,它只是1比18比例的汽车模型。

1091
量子位

星际2新智能体开源:单机并行能力强,适应环境广,个人可训练

今天,《星际争霸2》(后称星际2)深度强化学习(DRL)智能体Reaver开源了,引来大量Reddit用户围观。

933
量子位

刚刚,Facebook开源了星际争霸AI代码

在这个大赛里,来自Facebook AI Research团队的AI程序CherryPi,获得了亚军的好成绩,仅次于纯靠规则的三星战队。

1232
量子位

ICLR 2019评审意见上线:论文得分中位数连年下滑,最高分论文出炉

这两天,openreview网站放出了这些论文的评审结果,推特网友Horace He顺势抓取了上面的评分,统计了今年已放出论文的总体情况。

1013
量子位

人人能上手:OpenAI发射初学者友好的强化学习教程 | 代码简约易懂

他们刚刚发射了一套强化学习 (RL) 入门教程,叫做Spinning Up。真诚友好,无微不至。

1165

扫码关注云+社区

领取腾讯云代金券