专栏首页arxiv.org翻译专栏人类对视觉导航的最佳控制作为一个管家(CS AI)
原创

人类对视觉导航的最佳控制作为一个管家(CS AI)

现实世界中的导航要求机器人在陌生的动态环境中操作,并与人类共享空间。环游人类特别困难,因为它需要预测他们的未来运动,这可能会非常具有挑战性。我们提出了一种围绕人类导航的新颖框架,该框架将基于学习的感知与基于模型的最佳控制相结合。具体来说,我们的训练基于卷积神经网络(CNN)的感知模块,该模块将机器人的视觉输入映射到航路点或下一个所需状态。然后,将该航路点输入到计划和控制模块中,以将机器人安全有效地传送到目标。为了训练CNN,我们为在人类在场的情况下自动进行机器人导航贡献了逼真的基准测试数据集。使用从我们真实感数据集渲染的图像上的监督学习来训练CNN。所提出的框架学会仅基于单眼RGB图像来预期和响应人们的运动,而无需明确预测未来的人类运动。我们的方法可以很好地推广到模拟和现实环境中看不见的建筑物和人类。此外,我们的实验表明,与单纯基于学习的方法相比,将基于模型的控制与学习相结合可带来更好,更有效的数据导航行为。本项目的网站上提供描述了我们的方法和实验的视频。

标题:Visual Navigation Among Humans with Optimal Control as a Supervisor

原文作者:Varun Tolani, Somil Bansal, Aleksandra Faust, Claire Tomlin

原文:Real world navigation requires robots to operate in unfamiliar, dynamic environments, sharing spaces with humans. Navigating around humans is especially difficult because it requires predicting their future motion, which can be quite challenging. We propose a novel framework for navigation around humans which combines learning-based perception with model-based optimal control. Specifically, we train a Convolutional Neural Network (CNN)-based perception module which maps the robot's visual inputs to a waypoint, or next desired state. This waypoint is then input into planning and control modules which convey the robot safely and efficiently to the goal. To train the CNN we contribute a photo-realistic bench-marking dataset for autonomous robot navigation in the presence of humans. The CNN is trained using supervised learning on images rendered from our photo-realistic dataset. The proposed framework learns to anticipate and react to peoples' motion based only on a monocular RGB image, without explicitly predicting future human motion. Our method generalizes well to unseen buildings and humans in both simulation and real world environments. Furthermore, our experiments demonstrate that combining model-based control and learning leads to better and more data-efficient navigational behaviors as compared to a purely learning based approach. Videos describing our approach and experiments are available on the project website.

链接:https://arxiv.org/abs/2003.09354

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 缺乏奖励的流形分析中的期权发现(CS AI)

    事实证明,选项是强化学习的有效工具,有助于改进探索和学习。 在本文中,我们提出了一种基于频谱图理论的方法,并推导了一种系统地发现选项而无需访问特定奖励或任务分配...

    RockNPeng
  • 产生混合神经符号模型的新概念(CS AI)

    人类的概念知识是支持生成新颖而高度结构化的概念的能力,而这种概念知识的形式引起了认知科学家的极大兴趣。一种传统强调结构化知识,将概念视为嵌入直观理论中或组织为复...

    RockNPeng
  • 迈向基于无标签方面的情感分析:一种多注意力的网络方法(cs AI)

    现有的基于方面的情感分析(ABSA)方法利用各种神经网络模型通过学习特定于方面的特征表示来提取方面情感。然而,这些方法严重依赖于定义方面的用户评论的手动标记作为...

    RockNPeng
  • A Crash Course in 3D

    First, we do not pretend here that we will cover everything that is important fo...

    py3study
  • QQ & SF 首度联名创作

    ? 腾讯ISUX isux.tencent.com 社交用户体验设计 ? ? ? 01  概述  |  Overview Superfiction是韩国一家...

    腾讯ISUX
  • 将机器学习应用于金融技术领域的15家公司(英)

    用户1737318
  • RL12 Multi-agent systems

    代理是能够代表其用户或所有者采取独立行动的计算机系统。智能代理应具有以下主要属性:–反应性–积极主动–社交能力

    安包
  • What is agile software development?

    Agile software development is a set of management framework and practices to dev...

    用户4822892
  • Linux 搭建 maven

    Maven, 是基于项目对象模型(Project Object Model, POM),通过一小段描述信息来管理项目的构建,报告,文档的软件项目管理工具。

    阳光岛主
  • How to configure a BSP application to Fiori launchpad as a tile

    版权声明:本文为博主汪子熙原创文章,未经博主允许不得转载。 https://jerry.bl...

    Jerry Wang

扫码关注云+社区

领取腾讯云代金券