专栏首页arxiv.org翻译专栏基于功能群的分子性质预测超图卷积神经网络(CS)

基于功能群的分子性质预测超图卷积神经网络(CS)

我们提出了一种分子超图卷积网络(MolHGCN),利用原子和官能团信息作为输入,预测分子的分子属性。分子可以包含多种类型的官能团,这些官能团会影响分子的性质。例如,一个分子的毒性与毒物团有关,如硝基芳香基团和硫脲。传统的基于图的方法考虑了节点间的成对交互,不能灵活地表达图中节点间的复杂关系,使用多跳可能导致过平滑和过拟合问题。因此,我们提出MolHGCN利用原子和官能团信息来捕获分子之间的亚结构差异。MolHGCN使用来自输入SMILES字符串的功能组信息构造分子的超图表示,使用两阶段消息传递过程(原子和功能组消息传递)提取隐藏表示,并使用提取的隐藏表示预测分子的属性。我们使用Tox21、ClinTox、SIDER、BBBP、BACE、ESOL、FreeSolv和亲脂性数据集评估我们的模型的性能。我们证明了我们的模型能够在大多数数据集上优于其他基线方法。我们特别指出,结合官能团信息和原子信息,可以在潜在空间中获得更好的可分性,从而提高分子性质预测的预测精度。

原文题目:A Hypergraph Convolutional Neural Network for Molecular Properties Prediction using Functional Group

原文:We propose a Molecular Hypergraph Convolutional Network (MolHGCN) that predicts the molecular properties of a molecule using the atom and functional group information as inputs. Molecules can contain many types of functional groups, which will affect the properties the molecules. For example, the toxicity of a molecule is associated with toxicophores, such as nitroaromatic groups and thiourea. Conventional graph-based methods that consider the pair-wise interactions between nodes are inefficient in expressing the complex relationship between multiple nodes in a graph flexibly, and applying multi-hops may result in oversmoothing and overfitting problems. Hence, we propose MolHGCN to capture the substructural difference between molecules using the atom and functional group information. MolHGCN constructs a hypergraph representation of a molecule using functional group information from the input SMILES strings, extracts hidden representation using a two-stage message passing process (atom and functional group message passing), and predicts the properties of the molecules using the extracted hidden representation. We evaluate the performance of our model using Tox21, ClinTox, SIDER, BBBP, BACE, ESOL, FreeSolv and Lipophilicity datasets. We show that our model is able to outperform other baseline methods for most of the datasets. We particularly show that incorporating functional group information along with atom information results in better separability in the latent space, thus increasing the prediction accuracy of the molecule property prediction.

原文链接:https://arxiv.org/abs/2106.01028

原文作者:Fangying Chen,Junyoung Park,Jinkyoo Park

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 深度学习在医学影像上的应用(二)——图像重建及后处理,标注,回归,配准,图像超分辨率

    上一篇给大家介绍了深度学习在医学影像上分类的应用案例,这一篇我将分享深度学习在医学影像上关于图像重建及后处理,图像标注,图像配准,图像超分辨率和回归的应用。

    医学处理分析专家
  • 斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)

    CS230授课人为全球著名计算机科学家吴恩达和他的助教Kian Katanforoosh。

    机器学习AI算法工程
  • 斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)

    作为全球计算机四大名校之一,斯坦福大学的CS230《深度学习》课程一直受到全球计算机学子和从业人员的热烈欢迎。

    磐创AI
  • 斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)

    作为全球计算机四大名校之一,斯坦福大学的CS230《深度学习》课程一直受到全球计算机学子和从业人员的热烈欢迎。

    新智元
  • 斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)

    作为全球计算机四大名校之一,斯坦福大学的CS230《深度学习》课程一直受到全球计算机学子和从业人员的热烈欢迎。

    朱晓霞
  • CVPR2020 Oral | 动态多尺度图表达3D人体骨架运动,实现精准预测效果超SOTA

    现有的基于3D人体骨架的运动预测方法往往不考虑身体不同部位之间的关联关系,或是仅考虑单一尺度的关节点关系。

    新智元
  • CVPR2020 Oral | 动态多尺度图表达3D人体骨架运动,实现精准预测效果超SOTA

    现有的基于3D人体骨架的运动预测方法往往不考虑身体不同部位之间的关联关系,或是仅考虑单一尺度的关节点关系。

    代码医生工作室
  • 汇总|医学图像分析领域论文

    1.Globally Guided Progressive Fusion Network for 3D Pancreas Segmentation(MICCAI...

    3D视觉工坊
  • 图神经网络在生物医药领域的12项研究综述,附资源下载

    2020年,图机器学习(Graph ML)已经成为机器学习(ML)领域中的一个备受关注的焦点研究方向。其中,图神经网络(GNN)是一类用于处理图域信息的神经网络...

    机器之心

扫码关注云+社区

领取腾讯云代金券