专栏首页arxiv.org翻译专栏一种学习过滤拓扑空间简洁表示的域无关方法(CS)

一种学习过滤拓扑空间简洁表示的域无关方法(CS)

持久性图被广泛用于量化数据可视化中过滤拓扑空间的底层特征。在许多应用中,计算图表之间的距离是必要的;然而,计算这些距离一直是一个挑战,因为计算成本。在本文中,我们提出了一个持久化图哈希框架,该框架学习持久化图的二进制代码表示,它允许快速计算距离。该框架建立在生成式对抗网络(GAN)上,带有图距离损失函数来引导学习过程。我们没有尝试将图转换为向量化表示,而是将图散列为二进制代码,这在大规模任务中具有天然的优势。这个模型的训练是领域无关的,因为它可以完全从合成的,随机创建的图表中计算出来。因此,我们提出的方法可以直接适用于各种数据集,而不需要对模型进行再训练。这些二进制码,当比较使用快速汉明距离时,比其他向量化表示更好地保持了数据集之间的拓扑相似性。为了评估这种方法,我们将我们的框架应用于图表聚类问题,并将我们的方法的质量和性能与最先进的方法进行比较。此外,我们还展示了我们的方法在具有10k持久性图的数据集上的可伸缩性,这在当前技术中是不可能的。此外,我们的实验结果表明,我们的方法在保持可比或更好的质量比较的同时,使用更少的内存使用,速度明显更快。

原文题目:A Domain-Oblivious Approach for Learning Concise Representations of Filtered Topological Spaces

原文:Persistence diagrams have been widely used to quantify the underlying features of filtered topological spaces in data visualization. In many applications, computing distances between diagrams is essential; however, computing these distances has been challenging due to the computational cost. In this paper, we propose a persistence diagram hashing framework that learns a binary code representation of persistence diagrams, which allows for fast computation of distances. This framework is built upon a generative adversarial network (GAN) with a diagram distance loss function to steer the learning process. Instead of attempting to transform diagrams into vectorized representations, we hash diagrams into binary codes, which have natural advantages in large-scale tasks. The training of this model is domain-oblivious in that it can be computed purely from synthetic, randomly created diagrams. As a consequence, our proposed method is directly applicable to various datasets without the need of retraining the model. These binary codes, when compared using fast Hamming distance, better maintain topological similarity properties between datasets than other vectorized representations. To evaluate this method, we apply our framework to the problem of diagram clustering and we compare the quality and performance of our approach to the state-of-the-art. In addition, we show the scalability of our approach on a dataset with 10k persistence diagrams, which is not possible with current techniques. Moreover, our experimental results demonstrate that our method is significantly faster with less memory usage, while retaining comparable or better quality comparisons.

原文链接:https://arxiv.org/abs/2105.12208

原文作者:Yu Qin, Brittany Terese Fasy, Carola Wenk, Brian Summa

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Nat. Mach. Intel. | 突变后蛋白蛋白结合力的拓扑网络树预测模型

    今天给大家介绍密歇根州立大学数学系Guowei Wei教授团队2020年2月14日发表在Nature Machine Intelligence上的文章:A to...

    DrugAI
  • 【NSR特别专题】徐宗本 孙剑:模型驱动的深度学习

    编者按:《国家科学评论》于2018年1月发表“机器学习”特别专题,由周志华教授组织并撰写文章。专题内容还包括对AAAI前主席Tom Dietterich的访谈,...

    马上科普尚尚
  • PAMI-2021:5篇顶级GNN论文

    PAMI(IEEE Transactions on Pattern Analysis and Machine Intelligence),IEEE模式分析与机器...

    Houye
  • T-GCN:时间图卷积网络用于交通速度预测-模型实验部分

    《T-GCN: A Temporal Graph Convolutional Network for Traffic Prediction》。

    深度学习与交通大数据
  • [万字综述] 21年最新最全Graph Learning算法,建议收藏慢慢看

    今天小编给大家带来了一篇极全的2021最新图学习算法综述。该综述不仅囊括了目前热门的基于深度学习的图学习方法,还全面介绍了其它三个大类:基于图信号处理的方法、基...

    Houye
  • 学界 | 中科大潘建伟团队在光量子处理器上成功实现拓扑数据分析

    机器之心
  • 拓扑数据分析在机器学习中的应用

    用户1737318
  • KDD20 | AM-GCN:自适应多通道图卷积网络

    题目:AM-GCN: Adaptive Multi-channel Graph Convolutional Networks

    Houye
  • Facebook的人工智能从视频片段中学习物理位置之间的关系

    计算机视觉系统通常擅长探测物体,但却很难理解这些物体所处的环境。这是因为它们会将观察到的动作与物理环境分开——即使是那些做了模型环境的动作,也无法区分与动作相关...

    AiTechYun

扫码关注云+社区

领取腾讯云代金券