首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

ICML 23' | 对多重图进行解耦的表示学习方法

无监督多重图表示学习(UMGRL)受到越来越多的关注,但很少有工作同时关注共同信息和私有信息的提取。在本文中,我们认为,为了进行有效和鲁棒的UMGRL,提取完整和干净的共同信息以及更多互补性和更少噪声的私有信息至关重要。为了实现这一目标,我们首先研究了用于多重图的解缠表示学习,以捕获完整和干净的共同信息,并设计了对私有信息进行对比约束,以保留互补性并消除噪声。此外,我们在理论上分析了我们方法学到的共同和私有表示可以被证明是解缠的,并包含更多与任务相关和更少与任务无关的信息,有利于下游任务。大量实验证实了所提方法在不同下游任务方面的优越性。

04

Canny-VO: 基于几何3D-2D边缘对准的RGB-D视觉里程计

本文回顾了自由曲线配准的经典问题, 并将其应用于一个有效的称为Canny-VO的RGBD视觉里程计系统, 因为它能有效地跟踪从图像中提取的所有Canny边缘特征. 提出了边缘配准中常用的距离变换的两种替代方法:近似最近邻域和定向最近邻域. 3D/2D边缘对齐在效率和精度方面受益于这些替代公式. 它消除了对数据到模型配准、双线性插值和亚梯度计算等计算要求更高的范例的需求. 为了确保系统在存在异常值和传感器噪声时的鲁棒性, 配准被公式化为最大后验概率问题, 并且所得到的加权最小二乘目标通过迭代重新加权最小二乘方法来解决. 研究了各种稳健的权函数, 并根据残差的统计量进行了最优选择. 最近邻场的自适应采样定义进一步提高了效率. 对公共SLAM基准序列的广泛评估证明了最先进的性能和优于经典欧几里德距离场的优势.

02

Cerebral Cortex:一种用于大脑-行为关系研究的心理测量预测框架

最近以人群为基础的神经成像和行为测量研究为研究大脑区域连接和行为表型的个体间差异之间的关系开辟了前景。然而,基于连接的预测模型的多变量特性严重限制了神经科学对大脑行为模式的洞察。为了解决这一问题,我们提出了一种基于区域连通性的心理测量预测框架。本文首先阐述了两个主要的应用:1)单个脑区对一系列心理测量变量的预测能力;2)单个心理测量变量在不同脑区间的预测能力变化。我们将这些方法提供的大脑行为模式与激活方法提供的大脑行为关系进行了比较。然后,利用我们方法增加的透明度,我们展示了各种数据处理和分析的影响是如何直接影响大脑行为关系的模式,以及该方法提供的对大脑行为关系的独特见解。

02

手背静脉识别的图像处理算法

手背静脉识别技术作为一种全新的特征识别技术,相比于传统的生物识别技术(如指纹识别)具有许多明显的优势,然而对于该技术的研究尚处于刚刚起步阶段,使用计算机来直接进行静脉识别与身份匹配仍然较为困难,为了方便后续特征识别,提高静脉识别的准确度和优越性,有必要对获取的静脉图像进行一系列处理,得到静脉的骨架结构。 题目主要要求为: 1.对采集图像进行背景去除,取得手背部分; 2.计算采集手背的质心并提取手背有效区域; 3.提取手背静脉走势; 4.对提取的静脉进行细化处理,去除毛刺; 5.改进算法,提高程序的通用性和适普性; 6.在图像分割上尝试不同的方法,并比较结果的好坏。

04

Histograms of Oriented Gradients for Human Detection

以基于线性SVM的人体检测为例,研究了鲁棒视觉目标识别的特征集问题。在回顾了现有的基于边缘和梯度的描述符之后,我们通过实验证明了方向梯度(HOG)描述符的直方图网格在人类检测方面明显优于现有的特征集。我们研究了计算的各个阶段对性能的影响,得出结论:在重叠描述符块中,细尺度梯度、细方向边距、相对粗的空间边距和高质量的局部对比度归一化都是获得良好结果的重要因素。新方法在原有MIT行人数据库的基础上实现了近乎完美的分离,因此我们引入了一个更具挑战性的数据集,其中包含1800多张带注释的人类图像,具有大范围的姿态变化和背景。

04

Marior去除边距和迭代内容矫正用于自然文档矫正

本文简要介绍了论文“ Marior: Margin Removal and Iterative Content Rectification for Document Dewarping in the Wild ”的相关工作。照相机捕捉到的文档图像通常会出现透视和几何变形。考虑到视觉美感较差和OCR系统性能下降,对其进行纠正具有重要的价值。最近的基于学习的方法集中关注于精确裁剪的文档图像。然而,这可能不足以克服实际挑战,包括具有大边缘区域或没有边缘区域的文档图像。由于这种不切实际,用户在遇到大型边缘区域时难以精确地裁剪文档。同时,无边缘的变形图像仍然是一个难以解决的问题。据作者所知,目前还没有完整有效的pipeline来纠正文档图像。为了解决这个问题,作者提出了一种新的方法,称为Marior(边缘去除和迭代内容修正)。Marior采用渐进策略,以从粗到细的方式迭代地提高去变形质量和可读性。具体来说,作者将pipeline划分为两个模块:边缘去除模块(MRM)和迭代内容校正模块(ICRM)。首先,作者预测输入图像的分割掩膜去除边缘,从而得到初步结果。然后,作者通过产生密集的位移流来进一步细化图像,以实现内容感知的校正。作者自适应地确定细化迭代的次数。实验证明了作者的方法在公共基准上的最新性能。

02
领券