展开

关键词

目标驱动的长期(CS CV)

随着强大的序列建模和丰富的环境特征提取技术的应用,人类短期运动有了很大的进步。然而,长期仍然是当前方法的一个主要挑战,因为误差可能会在这一过程中累积。 事实上,对远至终点的一致和稳定的本质上要求对该的整体结构进行更深入的分析,这与行人对旅程目的地的意图有关。 在这项工作中,我们建议建立一个假设的过程来确定行人的目标,以及这一过程对未来长期的影响。我们设计了目标驱动的模型——一个实现这种直觉的双通道神经网络。 该模型在各种情况下,特别是在较大的范围内,其性能优于现有技术。这一结果再次证明了视觉和几何特征的自适应结构化表示在人类行为分析中的有效性。 原文作者:Hung Tran, Vuong Le, Truyen Tran 原文地址:https://arxiv.org/abs/2011.02751 目标驱动的长期(CS CV).pdf

44020

自动驾驶共享多模态(CS AI)

本文提出了一种用于在高度交互环境中交通未来框架。基于自动驾驶车辆均配备有各类传感器(例如:LiDAR扫描器,RGB摄像扥)的现实条件下,本研究旨在运用多种互补性输入通道来提高效果。 同时,我们为未来特别构建了一个生成模型并制定了带有额外正则项的目标函数。基于两个基准价值数据集,进行广泛评估来评价本文所提出框架的效果。

51720
  • 广告
    关闭

    什么是世界上最好的编程语言?丨云托管征文活动

    代金券、腾讯视频VIP、QQ音乐VIP、QB、公仔等奖励等你来拿!

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    ICRA 2020竞赛冠军的方法总结

    引言:行人问题是无人驾驶技术的重要一环,已成为近年来的一项研究热点。在机器人领域国际顶级会议ICRA 2020上,美团无人配送团队从一百多支队伍中脱颖而出,在行人竞赛中夺得第一名。 图1 ICRA 2020 TrajNet++竞赛 二、赛题简介 本次竞赛提供了街道、出入口、校园等十个复杂场景下的行人数据集,要求参赛选手根据这些数据集,利用行人在过去3.6秒的其在未来 该竞赛采用多种评价指标,这些评价指标分别对单模态模型和多模态模型进行评价。单模态模型是指给定确定的历史算法只输出一条确定的;而多模态模型则会输出多条可行的(或者分布)。 三、方法介绍 其实,美团在很多实际业务中经常要处理行人问题,而行人的难点在于如何在动态复杂环境中,对行人之间的社交行为进行建模。 此外,对于结果,我们也做了相应的后处理操作进行修正,主要是点的裁剪以及基于非极大值抑制的选择。

    41020

    ICRA 2020竞赛冠军的方法总结

    行人问题是无人驾驶技术的重要一环,已成为近年来的一项研究热点。在机器人领域国际顶级会议ICRA 2020上,美团无人配送团队从一百多支队伍中脱颖而出,在行人竞赛中夺得第一名。 该竞赛采用多种评价指标,这些评价指标分别对单模态模型和多模态模型进行评价。单模态模型是指给定确定的历史算法只输出一条确定的;而多模态模型则会输出多条可行的(或者分布)。 三、方法介绍 其实,美团在很多实际业务中经常要处理行人问题,而行人的难点在于如何在动态复杂环境中,对行人之间的社交行为进行建模。 图6 训练集与试集历史观中行人运动方向分布 针对上述问题,我们对训练集做了2项处理来提高训练集与试集分布的一致性: 平衡性采样; 场景数据正则化(缺失点插值,中心化以及随机旋转)。 此外,对于结果,我们也做了相应的后处理操作进行修正,主要是点的裁剪以及基于非极大值抑制的选择。

    63710

    原理简单的神经网络用于(CS)

    基于这些特性,我们提出了一个简单的卷积体系结构,其根植于代数拓扑的工具中,用于问题,并表明当使用奇数,非线性激活函数时,它遵循所有这三个属性。 然后,我们证明了该体系结构在合成和实际数据集上外推时的有效性,并特别强调了对看不见的的可概括性方面的收益。 原理简单的神经网络用于.pdf

    28130

    基于高斯过程动力学的仿真与

    原文题目:On Simulation and Trajectory Prediction with Gaussian Process Dynamics 建立的高斯过程(GP)动力学仿真和技术常常隐含地利用动力学模型连续函数评估的独立性假设 这可能导致严重的错误和不确定性的低估,潜在地导致安全关键应用程序的失败。本文讨论了考虑连续函数计算相关性的方法。 我们首先介绍两种基于采样的技术;一种方法提供真实分布的样本,适用于“地面真值”模拟,而另一种方法从GP的基函数近似中提取函数样本。 其次,我们提出一种基于线性化的技术,直接提供分布的近似,并明确考虑相关关系。我们在简单的数值例子中演示了这些步骤,并将结果与已建立的方法进行了对比。

    34800

    以车道图穿越为条件的多模态

    准确周围车辆的未来运动需要对目标和驾驶行为中固有的不确定性进行推理。这种不确定性可以松散地解耦为横向(如保持车道、转向)和纵向(如加速、制动)。 我们的模型在nuScenes运动数据集上实现了最先进的性能,并在质量上表现出优秀的场景适应性。详细的消融强调了政策展开和解码器结构的重要性。 以车道图穿越为条件的多模态.pdf

    21700

    自动驾驶算法:NeurIPS挑战赛冠军方案

    平均位移误差的计算方式为: 其中表示障碍物的数量,表示时刻数,表示真实,表示。 Part 3 流程 首先对符号作一些说明: 假设场景中障碍物的数量为,历史观时长为,所有障碍物的历史观为。则大小为xx,6维特征包含坐标、速度和类别。 的时长为,为,未来真实为,在输出一条的情况下,和大小均为xx。 此外,当存在高精地图时,假设场景中车道的数量为,车道的采样点个数为,场景(离散车道)可以被表示为。 解码过程主要包含高层交互和两个阶段。前者采用混合注意力网络Dec-MAT,后者使用基础的MLP实现与概率的多任务阶段。通过Backbone以后,经过两个MLP head分别输出概率。

    40710

    人群中人体:一个深度学习的视角

    中文题目:人群中人体:一个深度学习的视角 中文摘要:近几十年来,人类因其众多的现实应用而成为一个活跃的研究领域:疏散情况分析、交通操作、拥挤环境中社交机器人的部署等等。 在这项工作中,我们把人类的问题归结为学习人类社会互动的一种表现。早期的工作人员基于领域知识手工制作了这种表示。然而,在拥挤的环境中,社会互动不仅多样化,而且往往是微妙的。 为了客观地比较这些基于交互的模型的性能,我们开发了一个大规模的以交互为中心的基准TrajNet++,这是人类领域中一个重要但却缺失的组件。 我们提出了新的性能指标,评估模型输出社会可接受的的能力。在TrajNet ++上进行的实验验证了对我们提出的指标的需求,并且我们的方法在真实数据集和综合数据集上均优于竞争基准。 Alexandre Alahi 原文地址:https://arxiv.org/abs/2007.03639 PDF链接:https://arxiv.org/pdf/2007.03639.pdf 人群中人体

    33231

    美团无人配送斩获 CVPR 2019 挑战赛冠军

    人工智能领域国际顶级会议CVPR(计算机视觉与模式识别)于2019年6月17日在美国加利福尼亚州长滩市召开,美团无人配送与视觉团队喜获 CVPR 2019 障碍物挑战赛(Trajectory prediction 障碍物挑战赛 ? 参赛团队模型结果 在比赛中我们需要根据每个障碍物过去3秒的运动出它在未来3秒的。障碍物共有四种类型,包括行人、自行车、大型机动车、小型机动车。 每种障碍物的上的采样点来表示,采样的频率是2赫兹。我们最终以1.3425的成绩取得该比赛的第一名,同时我们也在研讨会现场分享了我们的算法模型思路。 ? 我们的规划团队正在协助我们的无人配送车小袋更好的进行试运营,而我们的细粒度图像检技术也在无人仓智能货柜等场景得到了很好的应用。

    56320

    干货 | 论文笔记:第一人称视角视频中的行人

    前几天日本东京大学在 arXiv 上放出的一篇论文(大概是 CVPR 投稿文章吧)提出了一个新的人体动作分析问题:第一人称视频中的行人问题,并提出了一个新的数据集以及一个新的行人算法。 算法构建 要构建行人算法,首先要确定要用什么信息/特征来进行行人的建模与学习。对于一小段视频中的行人,本文中主要提出了四种 feature 序列,如下所示: ? FDE指标即最终和最终实际之间的L2距离。 可以看出,这篇文章主要在行人这个问题中进一步限定了场景(第一人称视角视频)并提出了对应的数据集和算法。 这个问题其实可以进一步拓展为运动相机场景下的行人问题,这样就能够用于智能驾驶等更多的应用场景中了。

    1.1K60

    CVPR 2019 | 智能体张量融合,一种保持空间结构信息的

    该论文主要提出了一种基于深度学习的车辆和行人方法,提出了一个可以保持空间结构信息的多智能体张量融合网络,在机动车驾驶和行人数据集中对模型的性能进行了验证。 ? 每辆车的过去以不同的颜色显示,其后连接的是网络对这些车未来的采样。正确结果(Ground Truth)的以黑色显示,车道中心以灰色显示。 (d)当紫色车辆通过高速公路出口后,MATF 它将不会退出。 (e)在这里,MATF 无法精确的真实未来;然而,一小部分采样成功到了红色车辆将持续变道。 蓝线显示的是过去的,红色是真实的未来,绿色的是三个模型分别的未来。MATF 可以通过一个正向传播同时该图所示的所有的智能体的未来的。 绿色的越接近红色的真实未来就越准确。

    26140

    CVPR 2019 | 智能体张量融合,一种保持空间结构信息的方法

    该论文主要提出了一种基于深度学习的车辆和行人方法,提出了一个可以保持空间结构信息的多智能体张量融合网络,在机动车驾驶和行人数据集中对模型的性能进行了验证。 ? 每辆车的过去以不同的颜色显示,其后连接的是网络对这些车未来的采样。正确结果(Ground Truth)的以黑色显示,车道中心以灰色显示。 ? (d)当紫色车辆通过高速公路出口后,MATF 它将不会退出。 (e)在这里,MATF 无法精确的真实未来;然而,一小部分采样成功到了红色车辆将持续变道。 蓝线显示的是过去的,红色是真实的未来,绿色的是三个模型分别的未来。MATF 可以通过一个正向传播同时该图所示的所有的智能体的未来的。 绿色的越接近红色的真实未来就越准确。

    45720

    量化用于长期行人的标准基准数据集的复杂性(CS CV)

    在对行人模型进行基准试时,量化数据集复杂性的方法仍然是缺失的部分。 为了更好地理解数据集的复杂度,提出了一种从基于原型的数据集表示中推导复杂度分数的方法。 在几个行人基准试数据集上进行了大规模复杂性分析,然后简要讨论了行人和基准试的指标。 Hug, Stefan Becker, Wolfgang Hübner, Michael Arens 原文地址:https://arxiv.org/abs/2005.13934 量化用于长期行人的标准基准数据集的复杂性

    44600

    共6篇含图像翻译(FaceBook新作)元学习等(2022.3.10)

    它依赖于三个训练的组件。首先,我们在潜在空间中编辑输入图像,要求可以将各种图像编码和解码回具有最小失真的 RGB 图像。为此,我们选择了 VQGAN 自动编码器 。 的知识蒸馏 论文/Paper:https://arxiv.org/abs/2203.04781 代码/Code: SkinningNet: Two-Stream Graph Convolutional Neural Network for Skinning Prediction of Synthetic Characters SkinningNet:用于合成字符皮肤的双流图卷积神经网络 论文/Paper

    15120

    今日 Paper | 多研究;3DMM 人脸模型;对抗网络判别器;交叉模态信息等

    目录 多研究 针对VI-ReID的分层跨模态行人在识别 3DMM 人脸模型:从过去到现在到未来 一种基于U-Net的生成性对抗网络判别器 用于图像描述的交叉模态信息的探索和蒸馏 多研究 Trajectory Predictio 作者:Junwei Liang 发表时间:2020/2/1 论文链接:http://arxiv.org/pdf/1912.06445.pdf 推荐原因 研究意义: 问题是目前 基于此,本文利用多种不同类型研究了如何高效准确的出路径的可能分布,从而有助于未来在多目标方面的研究和应用。 创新点: 1、创建了一个基于我们现实世界中数据的3D模拟器数据集; 2、作者提出了一种新的模型,记为Multiverse,该模型可以准确地用于多。 ? ?

    29820

    【路径规划】开源 | 斯坦福大学--提出运动规划和控制的可解释的方案MATS

    特别是,行为在自主系统中的主要用途之一是告知机器人运动规划和控制。 然而,大多数规划和控制算法的原因是系统动力学,而不是的agent tracklets(即有序的路径点集),通常通过方法输出,这可能会阻碍它们的集成。 为此,我们建议混合仿射时变系统(MATS)作为的输出表示,这更适合下游规划和控制使用。我们的方法利用从概率工作中成功的思想,来学习在规划和控制文献中被充分研究的动态系统表示。 我们将本文的与提出的多模式规划方法相结合,并证明本文方法在大规模自动驾驶数据集上显著提高了计算效率。 主要框架及实验结果 ? ? ?

    17610

    【综述】【视觉】加拿大华为|太牛了!汇总了过去5年300多篇文章,包括视频、动作、身体运动

    pdf 代码: 来源:加拿大华为技术公司 论文名称:Deep Learning for Vision-based Prediction: A Survey 原文作者:Amir Rasouli 基于视觉的算法有广泛的应用 ,包括自动驾驶、监视、人机交互、天气报。 在本文中,我们将这些算法分为视频、动作、身体运动和其他应用。对于每个算法类别,我们着重介绍了常用的架构、训练方法和使用的数据类型。 此外,本文还讨论了基于视觉的任务中常用的评价指标和数据集。 下面是论文具体框架结构以及实验结果: ? ? ? ? ? ? ?

    35930

    基于神经网络StarNet的行人交互算法

    本文详细阐述了外卖平台在基于神经网络StarNet的行人交互算法的研究。有关算法的研究还在继续,希望能与同行一起交流学习。 1. 1.1  行人的意义 在无人车行驶过程中,它需要对周围的行人进行,这能帮助无人车更加安全平稳地行驶。我们可以用图1来说明周围行人的运动对于无人车行驶的重要性。 1.2  行人的难点 总体而言,行人的难点主要有两个 第一,行人运动灵活,难度大。 StarNet介绍 目前,现有的算法主要还是聚焦在对行人之间交互的建模,通常只使用LSTM即可。 在过程中,所有算法根据每个行人过去3.2秒的运动出它在未来3.2秒的。每0.4秒采样一个离散点,因此3.2秒的可以用8个离散点表示。

    32710

    扫码关注云+社区

    领取腾讯云代金券