本期介绍德州农工大学CSE系Shuiwang Ji 教授(http://people.tamu.edu/~sji/)团队被ICLR2022接收的两个工作:SphereNet与G-SphereNet。
Spherical Message Passing for 3D Molecular Graphs
SphereNet: 刘毅,王立梅等
文章地址:
https://openreview.net/forum?id=givsRXsOt9r
数据
本工作研究3D graphs。3D graphs包括原来的2D graph,以及每个节点的xyz坐标信息,如下图所示。现实中很多数据能表示成3D graphs,并且3D信息本身很重要。例如,对分子而言,一些重要的性质如键长、键角等都能从3D信息获得。
问题
在3DGNN以及信息传递(message passing)中, 怎么样完整的表示3D信息,以获得更好的数据表征?
分析
对于一个3D graph而言,它的结构由三个几个量唯一确定:距离(distance), 角度(angle), 以及二面角(torsion),如下图所示。
方法
球形信息传递(Spherical Message Passing-SMP)。该方法用距离,角度,二面角作为输入进行信息传递。SMP理论上近似完备,3D信息几乎没有损失。它能区分自然界中复杂的结构,比如手性。同时,SMP没有比之前的方法更复杂,这得益于SMP提出了一种新的计算二面角的思路。
网络
SphereNet。把SMP和由薛定谔方程得出来的具有物理意义的特征组合起来,得到SphereNet。SphereNet在三个广泛应用的数据集MD17,QM9,OC20上取得SOTA的结果,同时也很高效。
An Autoregressive Flow Model for 3D Molecular Geometry Generation from Scratch
G-SphereNet:罗由之等
文章地址:https://openreview.net/forum?id=C03Ajc-NS5W
背景
目前,将机器学习方法应用于分子生成和药物发现是计算化学中的一个非常火热的研究方向,深度生成模型已经被广泛地应用于分子图的生成。然而,分子图并不包含完整的分子信息,分子的量子性质必须要通过它的三维几何结构才能获取。因此,为了能够从头设计具有优秀量子性质的分子,我们提出了一种能够从头生成分子三维几何结构的生成模型。
问题
分子的三维几何结构一般是由原子的三维笛卡尔坐标表示,并且三维结构具有旋转和平移不变性。怎么样设计分子三维几何结构的生成模型,使得模型本身具有旋转和平移不变性,即对于任意一个三维结构,生成模型赋予它的似然值和赋予它旋转或者平移后的结构的似然值相同?
分析
显然,直接生成原子的笛卡尔坐标是不能满足旋转或平移不变性的。但是,如下图所示,原子的3D位置是可以通过相对于另一个焦点原子的距离(distance),相对于一个参考连线的角度(angle)以及相对于一个参考平面的二面角(torsion angle)来间接的确定。距离,角度和二面角这三者本身是满足旋转和平移不变性的,所以可以通过以这三者为生成目标来设计生成模型。
方法
我们提出了G-SphereNet方法,如下图所示,这是目前所有已知的方法中第一个利用自回归流模型来进行分子三维几何结构的从头设计与生成的方法。G-SphereNet方法采用了序列生成的方式,即每一步只生成一个原子。G-SphereNet通过生成距离,角度和二面角来间接地确定原子的3D位置。另外,我们用SphereNet作为骨架特征提取网络来有效地提取分子的三维信息。
实验
通过一系列的实验,我们证明G-SphereNet能够在的三维分子几何结构随机生成和基于量子性质的目标分子搜索上取得SOTA的结果。这证明我们的G-SphereNet模型具有很强的三维分子结构建模和搜索的能力。