首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

BMVC 2018 | 最佳学生论文:EPFL&FAIR提出QuaterNet,更好地解决人类动作建模问题

对人类动作进行建模对于许多应用都很重要,包括动作识别 [12, 34]、动作检测 [49] 及计算机图形学 [22] 等。最近,神经网络被用于 3D 骨骼关节部位序列的长 [22, 23] 、短 [14, 37] 期预测。神经方法在其他模式识别任务中非常成功 [5, 20, 29]。人类动作是一种带有高级内在不确定性的随机序列过程。给定一个观察的姿势序列,未来的丰富姿势序列与之相似。因此,内在不确定性意味着,即使模型足够好,在预测未来姿势的一个长序列时,相隔时间较长的未来预测不一定能够匹配推断记录。因此,相关研究通常将预测任务分为长期预测和短期预测。短期任务通常被称为预测任务,可以通过距离度量将预测与参考记录进行比较来定量评估。长期任务通常被称为生成任务,更难定量评估。在这种情况下,人类评估至关重要。

01

论文翻译 | 多鱼眼相机的全景SLAM

提出了一种基于特征的全景图像序列同时定位和建图系统,该系统是在宽基线移动建图系统中从多鱼眼相机平台获得的.首先,所开发的鱼眼镜头校准方法结合了等距投影模型和三角多项式,以实现从鱼眼镜头到等效理想帧相机的高精度校准,这保证了从鱼眼镜头图像到相应全景图像的精确转换.其次我们开发了全景相机模型、具有特定反向传播误差函数的相应束调整以及线性姿态初始化算法.第三,实现的基于特征的SLAM由初始化、特征匹配、帧跟踪和闭环等几个特定的策略和算法组成,以克服跟踪宽基线全景图像序列的困难.我们在超过15公里轨迹的大规模彩信数据集和14000幅全景图像以及小规模公共视频数据集上进行了实验.

02

彻底解决AI视觉深度估计

深度估计是一个不适定问题;不同形状或尺寸的物体,即使在不同距离上,也可能投影到视网膜上的同一图像上。我们的大脑使用多种线索来进行深度估计,包括单眼线索,如运动视差,以及双眼线索,如重影。然而,深度估计所需的计算如何以生物学合理的方式实现尚不清楚。基于深度神经网络的最新方法隐式地将大脑描述为分层特征检测器。相反,在本文中,我们提出了一种将深度估计视为主动推理问题的替代方法。我们展示了深度可以通过反转一个同时从二维对象信念预测眼睛投影的分层生成模型来推断。模型反演包括一系列基于预测编码原理的生物学合理的均匀变换。在非均匀视点分辨率的合理假设下,深度估计有利于采用主动视觉策略,通过眼睛对准对象,使深度信念更准确。这种策略不是通过首先将注意力集中在目标上然后估计深度来实现的;相反,它通过行动-感知循环结合了这两个过程,其机制类似于在物体识别过程中的快速眼球运动。所提出的方法仅需要局部的(自上而下和自下而上的)消息传递,可以在生物学上合理的神经回路中实现。

01
领券