前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【书籍推荐】历时3年,清华大学iDLab实验室打造Reinforcement Learning and Control课程及讲义

【书籍推荐】历时3年,清华大学iDLab实验室打造Reinforcement Learning and Control课程及讲义

作者头像
深度强化学习实验室
发布2021-01-29 14:42:20
7650
发布2021-01-29 14:42:20
举报

深度强化学习实验室

官网:http://www.neurondance.com/

来源:http://www.idlab-tsinghua.com/

作者:清华大学 iDLab实验室

编辑:DeepRL

一、iDLab实验室

实验室主页:http://www.idlab-tsinghua.com/thulab/labweb/index.html

The Intelligent Driving Laboratory (iDLAB) is a part of the School of Vehicle and Mobility (SVM) at Tsinghua University. This lab focuses on advanced automatic control and machine learning algorithms, and their applications on autonomous driving, connected vehicles, driver assistance and driver behavior analysis, etc. Our research interests are loosely divided into four categories: (1) Perception, decision and control for autonomous vehicles and driver assistance systems; (2) Reinforcement learning and optimal control; (3) Distributed estimation, learning and control; and (4) Large-scale optimization and control of eco-automation and electrified powertrain. We have achieved a series of important research results and peer-reviewed publications publicly available through this website.

二、书籍简介

《Reinforcementlearning and control》撰写从2018年启动,至今已历三年,目的是为清华大学开设的同名研究生课程“强化学习与控制”,准备英文授课讲义。最新版本的前5章已上传iDLab课题组网站,欢迎大家下载分享。

下载地址:http://www.idlab-tsinghua.com/thulab/labweb/publications.html?typeId=3&_types=

一、内容简介

汽车的智能化变革促使整个行业发生了翻天覆地的变化,自动驾驶、云控协同、驾驶辅助等一系列新技术如雨后春笋般涌现,它们在提升地面车辆行驶性能的同时,也为解决交通事故、排放污染、城市拥堵等问题提供了一条可行的途径。近年随着机器学习和自动控制的融合发展,以模仿人类大脑学习机制为原理的强化学习(RL,Reinforcement Learning)技术迅速进入人们的视野,它为大规模复杂系统的学习及动态系统的高实时在线控制提供了一套极具前景的解决方案。

图2 强化学习型自动驾驶框架

但是该方法的工程应用尚属于起步阶段。一个重要的原因是该方法既具有理论学习的复杂度,又具有工程实践的挑战性。理论上,它隶属于统计学习和最优控制领域的交叉结合部,涉及的数理基础较深,涵盖面较广,难以学习本质机理。实践上,入门者不易短期内熟练掌握关联的编程工具,而且若对算法原理不熟悉,难以对代码进行工程化调整,不能发挥算法的应有性能。为应对上述挑战,《Reinforcement Learning and Control》一书面向工程应用领域的科研人员和技术开发者,按照原理剖析、主流算法、典型示例三位一体的原则,逐一介绍该方法在动态系统的学习和控制领域的理论和应用,涉及马尔科夫决策、蒙特卡洛学习、时序差分学习、函数近似、策略梯度学习、近似动态规划、深度强化学习等知识点。

二、内容提要

全书总共包括11章。依次介绍RL概况及基础知识,免模型学习的蒙特卡洛法及时序差分法,带模型学习的动态规划法,间接型及直接型RL,无穷时域及有限时域的近似动态规划,深度强化学习和RL的各类拾遗。

样稿展示

作者简介

李升波,清华大学车辆与运载学院副院长、长聘教授、博导。研究领域:智能汽车与驾驶辅助、强化学习、最优控制等。主参编《Applied Methods and Techniques for Mechatronic Systems: Modeling,Identification and Control》、《AAC: Optimization, Controland Diagnosis》、《Road Vehicle Automation 3》和《Cooperative Intelligent Transport Systems: Towards High-level AutomatedDriving》等英文学术专著4部,《地面车辆原理》等中文译著1部。

实验室官网:http://www.neurondance.com/

实验室社区:http://deeprl.neurondance.com/

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-01-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 深度强化学习实验室 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、iDLab实验室
  • 二、书籍简介
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档