应用数学家Lek-Heng Lim使用代数、几何和拓扑的工具来回答机器学习中的问题

数据派THU

发布于 2023-03-29 11:00:03

5210

来源：ScienceAI本文约2800字，建议阅读5分钟芝加哥大学应用数学家 Lek-Heng Lim 说：「当它更高级时，任何主题都会变成数学。」

Lek-Heng Lim 渴望一场将纯数学和应用数学重新结合起来的复兴。他指出，这种区别在现代数学中似乎是基本的，实际上是最近才出现的。「纯数学和应用数学之间的分界发生在过去 80 年，」Lim 说。「我会主张回到过去。」

Lim 的研究让我们离这次重聚更近了一步。他使用代数、几何和拓扑等纯数学领域开发的工具研究机器学习和其他应用学科。

Lim 现在是芝加哥大学的教授，但在新加坡长大的他「对数学不太感兴趣，」他说。到了高中，他和一位正在读硕士的物理老师谈起老师的研究。

谈话激起了他对规范理论的兴趣。他说，这门学科「当然是物理学」，「但它非常数学化，将物理量建模为数学对象。」谈话使他踏上了成为数学家的旅程。

「大部分内容都在我脑海中浮现，但有些条款让我印象深刻，」Lim 说。「当我后来在教育中遇到他们时，感觉就像遇到了一位老朋友。」

2022 年，Lim 获得古根海姆奖（Guggenheim fellowship）。「Lek-Heng 是一位杰出的数学家，」杜克大学统计学教授 Sayan Mukherjee 在推荐古根海姆时写道。「他是他那一代最强大的应用数学家，他致力于数据科学的数值方法、代数和算法的接口。」

「我满足于填补我知识中的坑洞，」Lim 说。

将纯数学和应用数学之间的关系描述为不断发展是否公平？

是的。有点不幸的是，我们甚至在讨论纯数学和应用数学之间的关系。这意味着它们是独立的实体。

看看从前的日子。看看高斯、费马或欧拉。甚至晚到冯诺依曼或希尔伯特的人。他们似乎没有做出那种区分。对他们来说，一切都是纯数学，一切都是应用数学。

高斯的工作不仅仅是二次互易和高斯曲率。这也是诸如最小二乘问题和试图找到行星轨迹之类的事情。本质上，他发明了线性回归。这在统计中非常重要。

看看希尔伯特著名的 23 个问题清单。其中一些在应用数学和动力系统方面有着深厚的根基。其中一些植根于纯数学和逻辑。

冯诺依曼对量子力学、数理逻辑、数值分析、博弈论和算子代数感兴趣。

当然，这两个领域现在都非常广泛，任何人都不可能知道所有事情。我认为，在应用数学方面，纯数学家应该知道某些事情。坦率地说，应用数学家通过提高他们对几何、拓扑和代数方面的现代工具的认识，可以获得很多收获。

在 2020 年的一篇论文中，你将深度神经网络与拓扑联系起来。如何？

论文链接：

https://dl.acm.org/doi/abs/10.5555/3455716.3455900

过去，计算机发现很难做一些人类可以轻松完成的事情：比如识别咖啡杯不是猫。即使是年幼的孩子也可以相对轻松地做到这一点。但是计算机没有这种能力。

这种情况在 2012 年左右开始发生变化。深度神经网络是关键，这意味着具有多层的神经网络。我猜，发生的事情是这些层意味着什么。这是我的看法。

我和我的博士生 Greg Naitza 一起研究这个问题。他现在在 Facebook 工作。这个想法是：让我们举个例子，所有猫图像的集合和所有不是猫的图像的集合。我们将把它们视为 [拓扑形状或流形]。一个是猫的流形，另一个是非猫的流形。这些将以某种复杂的方式交织在一起。为什么？因为有些东西看起来很像猫，但它们不是猫。美洲狮有时会被误认为是猫。重要的是，两个流形以某种非常复杂的方式交织在一起。

这些如何阐明神经网络？

我们进行了实验以证明这些流形得到了简化。最初，它是两个复杂的形状，错综复杂地交织在一起，但它被简化了。我如何测量形状的这种简化？嗯，有一个工具是计算拓扑的支柱。这使我们能够测量这些物体的形状。

这是什么工具？

这是持久的同源性。

首先，同源性本质上是一种将不同类型的几何对象的不同孔分类到变形的方法。从同源性的角度来看，几何上看起来非常不同的孔看起来是相同的。

如果我只有从流形中采样的点而不是整个流形的知识怎么办？例如，猫的形象：你在电脑屏幕上看到的猫的形象和真正的猫有什么区别？一张图片有像素，所以如果你放大得足够远，你只会看到离散的点。那样的话，我怎么谈同源性呢？