首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

ICML 23' | 对多重图进行解耦的表示学习方法

无监督多重图表示学习(UMGRL)受到越来越多的关注,但很少有工作同时关注共同信息和私有信息的提取。在本文中,我们认为,为了进行有效和鲁棒的UMGRL,提取完整和干净的共同信息以及更多互补性和更少噪声的私有信息至关重要。为了实现这一目标,我们首先研究了用于多重图的解缠表示学习,以捕获完整和干净的共同信息,并设计了对私有信息进行对比约束,以保留互补性并消除噪声。此外,我们在理论上分析了我们方法学到的共同和私有表示可以被证明是解缠的,并包含更多与任务相关和更少与任务无关的信息,有利于下游任务。大量实验证实了所提方法在不同下游任务方面的优越性。

04

Chem. Sci. | 微调语言大模型,深挖化学数据矿

化学文献中蕴含着丰富信息,通过“化学文本挖掘技术”提取关键数据,从而构建庞大的数据库,不仅能够为实验化学家提供详尽的物理化学性质和合成路线指引,还能够为计算化学家提供丰富的数据和洞见用于模型构建和预测。然而,由于化学语言的复杂性和论文风格的多样性,从化学文献中提取结构化数据是一项极具挑战性的任务。因此,许多文本挖掘工具应运而生,旨在解决这一棘手难题,助力科学研究迈向新的高峰。然而,这些针对特定数据集和语法规则构建的文本提取模型往往缺乏灵活的迁移能力。近两年,以ChatGPT为代表的大语言模型(LLMs)风靡全球,引领了人工智能和自然语言处理领域的快速发展。能否利用通用大语言模型强大的文本理解和文字处理能力,从复杂化学文本中灵活准确地提取信息,解放数据标注工人的劳动力,加速领域数据的收集呢?

01

SuperLine3D:从3D点到3D线

这个工作来自于浙江大学和DAMO academy。在点云配准领域,尽管已经有很多方法被提出来,但是无论是传统方法,还是近年来蓬勃发展的基于深度学习的三维点云配置方法,其实在真正应用到真实的LiDAR扫描点云帧时都会出现一些问题。造成这种困窘的一个主要的原因在于LiDAR扫描到的点云分布极不均匀。具体而言,相较于RGBD相机,LiDAR的有效扫描深度要大很多。随着深度的增大,其激光发射出去的扇面将会变得稀疏。因此,即使是扫描同一目标或场景的点云帧之间,其尺度并不一致。导致想要研究的关键点周围的邻域点分布也存在较大不同,难以通过这些3D点的特征描述关联起点云帧。这个问题一直以来都十分棘手。这个工作独辟蹊径,提出对于这种点云数据,不再通过3D点来构建关联以实现点云配准,而是研究点云数据中的高层次的几何原语。这种做法直观来说是有道理的,因为这些高层次的几何原语通常会有较大的支撑点集,换句话说,其对于点云扫描和采样具有较大的鲁棒性,通常不会因为某个点没有被记录而影响相应几何原语的提取。同时,几何原语通常具有更具体的特征和几何结构,例如一条直线、一个平面等,其更容易构建不同帧间的关联,避免误匹配。但是,这种研究思路通常难度较大,原因在于缺乏足够的有标签的数据集。在这种情况下,这个工作显得极其重要,它不仅仅提供了一个数据集自动标注模型,同样也是少数真正开始探索几何原语用于点云配准任务的先河性的工作。

02
领券