首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

通过自动强化学习(AutoRL)进行远程机器人导航 | 强化学习系列

仅在美国就有300万人因行动不便而无法离开家门。可以自动长距离导航的服务机器人可以提高行动不便人员的独立性,例如,通过为他们提供杂货,药品和包裹。研究表明,深度强化学习(RL)擅长将原始感官输入映射到动作,例如学习掌握物体和机器人运动,但RL 代理通常缺乏对长距离导航所需的大型物理空间的理解,并且很难适应新的空间。 在最近的三篇论文中,“ 使用AutoRL学习导航行为端到端 ”,“ PRM-RL:通过结合强化学习和基于采样的规划来实现远程机器人导航任务 ”,以及“ 使用PRM进行远程室内导航” RL “,我们通过将深度RL与远程规划相结合来研究易于适应的机器人自治。我们培训当地规划人员执行基本的导航行为,安全地穿越短距离而不会与移动的障碍物发生碰撞。当地规划人员采用嘈杂的传感器观测,例如一维激光雷达提供到障碍物的距离,并输出机器人控制的线性和角速度。我们使用AutoRL训练本地计划员进行模拟,AutoRL是一种自动搜索RL奖励和神经网络架构的方法。尽管它们的范围有限,只有10到15米,但是当地的规划者可以很好地转移到真正的机器人和新的,以前看不见的环境。这使我们能够将它们用作大空间导航的构建块。然后,我们构建路线图,其中节点是位置的图形,只有当本地规划人员能够可靠地模拟真实机器人及其噪声传感器和控制时,边缘才能连接节点。 自动化强化学习(AutoRL)

05
领券