原文题目:Learning Variable Impedance Control for Contact Sensitive Tasks
摘要:强化学习算法在解决从玩电子游戏到机器人等各种问题方面都取得了很大的成功。然而,他们很难解决微妙的机器人问题,特别是那些涉及接触互动的问题。虽然原则上输出联合力矩的策略应该能够学习这些任务,但在实践中我们发现,在没有任何行动空间结构的情况下,它们很难有力地解决问题。本文研究了在接触不确定的情况下,动作空间的选择是如何给出鲁棒性能的。我们建议学习一种策略,在联合空间输出阻抗和期望位置作为系统状态的函数,而不对问题施加任何其他结构。比较了该方法在不同接触不确定性下的转矩和位置控制策略的性能。对两种不同系统的仿真结果表明,该方法在学习速度和对环境不确定性的鲁棒性方面均优于输出转矩或位置的策略。
原文地址:https://arxiv.org/abs/1907.07500
作者:Miroslav Bogdanovic, Majid Khadiv, Ludovic Righetti
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。