首页
学习
活动
专区
工具
TVP
发布

机器人网

专栏作者
2555
文章
2333685
阅读量
139
订阅数
强化学习方法汇总,以及他们的区别
了解强化学习中常用到的几种方法,以及他们的区别, 对我们根据特定问题选择方法时很有帮助. 强化学习是一个大家族, 发展历史也不短, 具有很多种不同方法. 比如说比较知名的控制方法 Q learning, Policy gradients, 还有基于对环境的理解的 model-based RL 等等. 接下来我们通过分类的方式来了解他们的区别. 因为本文原作是一段6分钟视频介绍. 所以首先放视频链接: 优酷http://v.youku.com/v_show/id_XMTkyMDY5MTk2OA==.htm
机器人网
2018-04-25
1.1K0
机器人后空翻回旋踢都不是事,关键在这个强化学习新方法…
波士顿动力人形机器人的后空翻技能亮相时,惊艳了全球群众。 这么复杂的动作,不用说现实世界中的机器人,就算是在模拟器里,学起来也非常的难。 现在,加州大学伯克利分校和英属哥伦比亚大学最新研究的一种新方法
机器人网
2018-04-19
7530
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档