专栏首页arxiv.org翻译专栏Plan2Vec: 基于潜在计划的无监督表示学习(CS LG)
原创

Plan2Vec: 基于潜在计划的无监督表示学习(CS LG)

在本文中,我们介绍了 Plan2Vec,一种无监督表示学习方法,它的灵感来自于强化学习。Plan2Vec 使用近邻距离在图像数据集上构建一个加权图,然后通过提炼在计划路径上的路径积分,将这个局部度量推导到全局嵌入。当应用于控制时,Plan2Vec 提供了一种学习目标条件值估计的方法,这种方法可以在长范围内准确地学习目标条件值估计,而且计算和采样效率都很高。我们在一个模拟和两个具有挑战性的真实世界图像数据集上证明了 Plan2Vec 的有效性。实验结果表明,Plan2Vec 成功地摊销了规划成本,实现了在内存和计算复杂度上是线性的反应式规划,而不是在整个状态空间中的线性规划。

原文题目:Plan2Vec: Unsupervised Representation Learning by Latent Plans

原文:In this paper we introduce plan2vec, an unsupervised representation learning approach that is inspired by reinforcement learning. Plan2vec constructs a weighted graph on an image dataset using near-neighbor distances, and then extrapolates this local metric to a global embedding by distilling path-integral over planned path. When applied to control, plan2vec offers a way to learn goal-conditioned value estimates that are accurate over long horizons that is both compute and sample efficient. We demonstrate the effectiveness of plan2vec on one simulated and two challenging real-world image datasets. Experimental results show that plan2vec successfully amortizes the planning cost, enabling reactive planning that is linear in memory and computation complexity rather than exhaustive over the entire state space.

原文作者:Ge Yang, Amy Zhang, Ari S. Morcos, Joelle Pineau, Pieter Abbeel, Roberto Calandra

原文地址:https://arxiv.org/abs/2005.03648

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 如果可以的话请纠正我:从纠错和标记中学习(CS CL)

    Sequence-to-sequence 学习涉及到训练数据的信号强度和注释成本之间的权衡。例如,机器翻译数据从成本高昂的由专家生成的翻译数据来实现有监督学习,...

    刘持诚
  • PnPNet:具有环路跟踪的端到端感知和预测(CS CV)

    我们在自动驾驶汽车的背景下解决联合感知和运动预测问题。为了实现这一目标,我们提出了 PnPNet,这是一个端到端的模型,它将连续的传感器数据作为输入,并在每个时...

    刘持诚
  • 浅层神经网络能战胜维度的诅咒吗?一个平均场训练视角(CS LG)

    我们证明了对经验风险或人口风险的两层神经网络进行梯度下降训练,在均值场缩放下,人口风险的下降速度可能不会快于 。因此,梯度下降训练用于拟合合理平滑但真正的高维...

    刘持诚
  • centos7安装MongoDB3.4

    简介 MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。他支持的数据结构非常松散,是类似json的...

    拓荒者
  • FocusNet:解决小器官难分割问题(MICCAI 2019)

    今天分享一篇发表在MICCAI 2019上的关于医学影像处理中小器官分割的论文:FocusNet: Imbalanced Large and Small Org...

    Minerva
  • 干货 | QMQ在携程的落地实践

    QMQ(Qunar Message Queue)诞生于去哪儿网,初版基于MySQL存储。随着集团业务系统越发倚重消息解耦上下游,业务量的上涨随之带来消息量的增长...

    携程技术
  • 002.MongoDB社区版安装

    提示:奇数次要版本(例如3.5)是开发版本,不适合生产使用。本实验采用最新4.0版本,更多repo配置参考见:https://repo.mongodb.org/...

    木二
  • 地图上覆盖物压盖的优化

    在做webgis的时候,会经常性的碰到地图覆盖物压盖的情况。本文讲述一种基于聚类思路的解决办法,实现使用的是openlayers4+。

    lzugis
  • 面试中经常问到的 长连接&短连接,你了解的多吗?

    今天是周三(2020-04-29),分享一句谚语 “书读百遍,其义自见” 。分享给大家的是 「网络服务 模块」- 长连接&短连接。

    八点半的Bruce、D
  • MyBatis框架动态查询Sql

    今天写一个接口,查询监测数据,传感器有100多个监测因子,也就是数据库中一条数据对应100多个字段,前端勾选需要查询的监测因子,所以接口就需动态查询字段,幸运的...

    赵哥窟

扫码关注云+社区

领取腾讯云代金券