原文题目:Improved Reinforcement Learning through Imitation Learning Pretraining Towards Image-based Autonomous Driving
摘要:提出了一种以当前摄像机图像和车速为输入的自主驾驶任务的训练流水线,以产生油门、制动器和转向控制输出。模拟器Airsim的方便的天气和照明API在训练过程中提供了足够的多样性,这对于提高训练策略的鲁棒性很有帮助。为了不限制可能的策略的性能,我们使用了一个连续的、确定性的控制策略设置。我们利用ResNet-34作为我们的演员和评论家网络,在完全连接的层中有一些细微的变化。考虑到人类对这一任务的掌握和任务的高复杂性,我们首先利用模仿学习来模仿给定的人的策略,并将训练的策略及其权重运用到我们使用DDPG的强化学习阶段。与纯模仿学习和纯DDPG相比,这种组合对自主驾驶任务的性能有很大的提高。
原文地址:https://arxiv.org/abs/1907.06838
作者:Tianqi Wang, Dong Eui Chang
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。