前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【模仿学习】南京大学&港中文联合总结: 29页中文详述模仿学习完整过程

【模仿学习】南京大学&港中文联合总结: 29页中文详述模仿学习完整过程

作者头像
深度强化学习实验室
发布2022-09-23 14:29:04
4430
发布2022-09-23 14:29:04
举报
文章被收录于专栏:深度强化学习实验室

深度强化学习实验室

官网:http://www.neurondance.com/

论坛:http://deeprl.neurondance.com/

来源:南京大学, 香港中文大学团队

作者: 许天,李子牛,俞扬

简介

模仿学习,是一种从专家示例中进行学习的方法。这里专家示例指的是由最优(或者次优)策略采集到的状态-动作序列,智能体便是通过模仿专家示例来学习策略。模仿学习主要包含两大类算法框架:行为克隆和对抗式模仿学习。基于这两种算法框架,研究者们提出了各种各样的模仿学习算法,在实验中取得了很好的效果。尽管已经有很多对模仿学习算法的实验研究,关于模仿学习算法的理论分析直到最近才被逐步建立和完善。这些理论结果很好地解释了算法的实验现象,并且对今后的算法设计也有启发。 模仿学习简要教程着重从统计学习理论的角度来介绍模仿学习算法,能使读者对模仿学习算法有深刻的理解,使读者能够通过借助理论来分析已有的实验结果、并且设计更好的算法。

完整版PDF下载方式:

(1)登录论坛下载(未注册显示无权限下载)

http://deeprl.neurondance.com/d/382-29

(2) https://www.lamda.nju.edu.cn/xut/Imitation_Learning.pdf

教程细节

完整版PDF下载方式:

(1)登录论坛下载(未注册显示无权限下载)

http://deeprl.neurondance.com/d/382-29

(2) https://www.lamda.nju.edu.cn/xut/Imitation_Learning.pdf

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-08-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 深度强化学习实验室 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 简介
  • 完整版PDF下载方式:
  • 教程细节
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档