专栏首页arxiv.org翻译专栏TD-RL机器人系统的透明化(CS RO)
原创

TD-RL机器人系统的透明化(CS RO)

对自主、灵活的HRI提出了很高的要求,这就意味着在机器人控制中必须部署机器学习(ML)机制。事实上,ML技术的使用,例如强化学习(RL),使得机器人在学习过程中的行为对观察用户不透明。在这项工作中,我们提出了一个情感模型,以提高人类机器人协作场景中RL任务的透明度。我们提出的体系结构支持RL算法,它具有一个既能接收人类反馈又能根据学习过程表现情感反应的情感模型。该模型完全基于时间差分(TD)误差。该体系结构在一个单独的实验室中通过简单的设置进行了测试。研究结果表明,通过情绪反应来显示机器人的内部状态,足以使机器人对人类教师透明。人们也喜欢与反应灵敏的机器人互动,因为他们习惯于通过情感和社会信号来理解自己的意图。

原文题目:Towards Transparency of TD-RL Robotic Systems with a Human Teacher

原文:The high request for autonomous and flexible HRI implies the necessity of deploying Machine Learning (ML) mechanisms in the robot control. Indeed, the use of ML techniques, such as Reinforcement Learning (RL), makes the robot behaviour, during the learning process, not transparent to the observing user. In this work, we proposed an emotional model to improve the transparency in RL tasks for human-robot collaborative scenarios. The architecture we propose supports the RL algorithm with an emotional model able to both receive human feedback and exhibit emotional responses based on the learning process. The model is entirely based on the Temporal Difference (TD) error. The architecture was tested in an isolated laboratory with a simple setup. The results highlight that showing its internal state through an emotional response is enough to make a robot transparent to its human teacher. People also prefer to interact with a responsive robot because they are used to understand their intentions via emotions and social signals.

原文地址:https://arxiv.org/abs/2005.05926

原文作者:Marco Matarese,Silvia Rossi,Alessandra Sciutti,Francesco Rea

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 不确定性鲁棒:控制屏障功能实现安全的多代理交互(CS RO)

    在现实环境中运行的机器人必须在导航和维护安全性的同时,与许多异构主体和障碍物进行交互。多智能体控制屏障功能(CBF)已经成为一种计算效率高的工具,可以保证多智能...

    时代在召唤
  • PBCS:通过强化学习和运动计划之间的协同作用进行有效的探索和开发(CS RO)

    勘探与开发之间的权衡是强化学习(RL)的核心。但是,最近的RL研究中使用的大多数连续控制基准仅需要本地探索。这导致了具有基本探索功能的算法的发展,并且在需要更多...

    时代在召唤
  • CLARIAH中的本体论:迈向历史,语言和媒体的互操作性(CS CAS)

    数字人文科学的最重要目标之一就是通过扩大学术研究规模,链接现有数据库或改善数据可访问性,为研究人员提供有关新研究问题的数据和工具。在此,FAIR原则提供了一个有...

    时代在召唤
  • ESP8266 SDK开发: 物联网篇-ESP8266连接MQTT服务器实现通信控制

    https://www.cnblogs.com/yangfengwu/p/11762642.html

    杨奉武
  • 比爬楼梯更难!伯克利CMU让双足机器人在乱石间跨越行走

    【新智元导读】最近,加州大学伯克利分校和卡内基梅隆大学,展示了ATRIAS足式机器人能够在随机变换的障碍地形中行走的过程:尽管踏脚石高度和之间的宽度随机变化,但...

    新智元
  • 【文末福利】聊天机器人的几种主要架构实现

    在过去的20年中,互联网,把人们带入了一个全新的时代。在这个全新的时代,我们创造出了四种连接方式:一是人和物品之间的连接,二是人与人之间的连接,三是人和信息之间...

    zenRRan
  • MIT推出新一代机器人猎豹3,可用于灾害救援

    镁客网
  • 深圳Java培训:游戏中寻找学习JAVA的乐趣

    本篇主要介绍RobocodeAPI中的各种常见函数的说明,便于使用函数时有更清晰的思路。

    深圳java培训技术
  • 日本的“机器人王国”是怎样长成的?

    虽然第一台机器人在美国诞生,但是晚于美国起步的日本工业机器人产业发展迅猛,如今已成为全球机器人产销大国,并且赢得“机器人王国”的美称。目前,世界各国都争相投入资...

    机器人网
  • 清华机器人乐队“墨甲”诞生了:中国风浓郁,还演出了舞台剧

    乐队刚刚完成了首演,那是名叫《墨甲幻音》的舞台剧。苍翠的竹林,池上的莲花,冬季萧瑟的山野间,有生灵在奔跑:

    量子位

扫码关注云+社区

领取腾讯云代金券