
深度强化学习已成功地应用于各种计算机游戏中。但在实际应用中,特别是在机器人自动导航的连续控制中,仍然很少使用。在这段视频中,我们介绍了在未知环境下机器人学习自主导航的一种方法。
机器人的输入仅仅是二维激光扫描仪和RGBD摄像机的融合数据以及目标的方向,而地图则是未知的。输出量是机器人的动作(速度,线性,角度)。导航器(小型GA3s)在快速、并行、自主的仿真环境中进行预训练,然后部署到真实的机器人上。为了避免过拟合,我们只使用一个小的网络,并在激光数据中加入随机高斯噪声。
与其他方法相比,RGBD相机的传感器数据融合使得机器人能够在真实的三维避障环境中进行导航,并且不需要环境干预。