腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

深度学习入门与实践

专栏作者

48

文章

72112

阅读量

44

订阅数

【资料总结】| Deep Reinforcement Learning 深度强化学习

深度学习 github git 开源 html

　　在机器学习中，我们经常会分类为有监督学习和无监督学习，但是尝尝会忽略一个重要的分支，强化学习。有监督学习和无监督学习非常好去区分，学习的目标，有无标签等都是区分标准。如果说监督学习的目标是预测，那么强化学习就是决策，它通过对周围的环境不断的更新状态，给出奖励或者惩罚的措施，来不断调整并给出新的策略。简单来说，就像小时候你在不该吃零食的时间偷吃了零食，你妈妈知道了会对你做出惩罚，那么下一次就不会犯同样的错误，如果遵守规则，那你妈妈兴许会给你一些奖励，最终的目标都是希望你在该吃饭的时候吃饭，该吃零食的时候吃零食，而不是在不合适的时间吃零食。同样，曾经风靡过一段时间的Flappy bird，很多玩家在短时间内达到了高分，是怎么做到的呢？除了非常厉害的玩家是真的自己手动玩的高分，其实很多高分是通过我们用强化学习的方法来训练一个模型，让小鸟自己学习如何不碰到障碍物一直往前飞，获得最高分。此外，大家熟知的Alpha Go，其实也是强化学习训练的模型，不过是深度强化学习。

2019-05-25

6410

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态