前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >IEEE TNNLS | 利用分子几何特征进行分子生成

IEEE TNNLS | 利用分子几何特征进行分子生成

作者头像
DrugAI
发布2022-03-25 13:57:26
5710
发布2022-03-25 13:57:26
举报
文章被收录于专栏:DrugAI

近日,湖南大学、厦门大学和德睿智药团队在顶级期刊《IEEE Transactions on Neural Networks and Learning Systems》(IF:10.5)上发表研究论文。IEEE TNNLS创办于1990年,属机器学习、信息科学、人工智能的交叉学科领域,是神经网络和学习系统方面的国际顶级杂志,也是中科院分区1区Top期刊。录用论文标题为《Geometry-based Molecular Generation with Deep Constrained Variational Autoencoder》,该论文致力于研究分子3D表征学习问题,利用分子的几何特征进行分子生成。

以下为研究背景,方法,实验与结论

1

背景

在药物发现领域,寻找具有所需化学性质的候选药物分子是一项至关重要的挑战。传统上,寻找新药是一个漫长而昂贵的过程,失败率非常高,通过神经网络的模型生成具有某些特定性质的药物分子,已经显示出加速药物发现过程的强大潜力,该过程试图以数据驱动的方式探索更广阔的化学空间。以往关于分子生成的工作主要是基于1D SMILES字符串和2D分子图来表示分子,然后通过使用各种框架来学习采样的潜在空间。1D SMILES不能捕捉长距离依赖,由于忽略分子结构特征,无法学习平滑的分子嵌入;2D 分子图更容易更直观地表达分子,但对于类似的分子图,它们往往具有非常不同的 3D 结构和分子性质。1D 和 2D 的特征编码将特征的发现限制在预先定义的分子1D 或 2D 结构,消除了发现任何特征的能力,空间结构是决定分子性质和理解其在物理世界中作用原理的最关键因素之一,捕捉三维空间结构特征对于分子生成至关重要。

论文基于几何嵌入的分子生成模型,提出一种新颖的约束变分自编码器,所提出的模型达到了具有竞争力的性能,意味着其潜在有效性使药物发现的广阔化学空间的探索成为可能。

2

方法

模型主要分为三部分,分别是基于3D空间结构的分子可视化表征,基于蛋白质表面的几何特征的图表征,以及基于几何表示的约束变分自编码器GEOM-CVAE。

图1. GEOM-CVAE 架构图

基于3D空间结构的分子可视化表征:借鉴计算机视觉中CNN的广泛应用,我们提出了将分子空间结构编码为图片的表征方式,即将分子空间坐标转换为图片的RGB属性后使用CNN进行特征提取。后进入VAE模型。

图2. 药物分子空间结构可视化表征

基于蛋白质表面的几何特征的图表征:蛋白质的结构以 3-D 网格的形式表示,并通过基于曲率的二次误差度量算法简化了网格结构至原来的1/5。每一次蛋白质结构的简化都伴随着Chebyshev图卷积的操作。每一次网格的简化也可以看作是图采样和图神经网络中的图池化。GGC 网络中最后两层的输出输入到 GEOM-CVAE 的解码器为限制条件。

图3. 基于几何的蛋白质图表征

3

实验

实验使用PubChem数据库中的AID1706新冠肺炎生物测定数据,即基于 Qfrets 的初级生化高通量筛选试验,以鉴定 SARS 冠状病毒 3C 样蛋白酶 (3CLPro) 的抑制剂。基线方法包括基于VAE的模型:JT-VAE、 Graph-VAE、 Character-VAE、 Grammar-VAE、SD-VAE;基于自回归模型:AR-LSTM;和基于流的模型:GraphNVP和 GRF。分别从分子重构与有效性、分子3D结构相似性、分子化学性质评价等方面进行评估。表一发现该模型与基于VAE,Flow,AR的模型相比具有性能上的优势。

表1. 性能对比结果

对模型生成的1000个分子进行并计算其类药性分数以及新颖性后发现GEOM-CVAE生成的类药性优秀的分子同时也具有很好的新颖性。

表2. 具有前五 QED 分数的生成的新颖分子

4

结论

在这项工作中,设计了一个名为GEOM-CVAE的基于分子几何特征的VAE模型用于分子生成。这个模型引入了小分子以及蛋白质的几何特征,提高了模型的性能。

参考资料

Li, C., Yao, J., Wei, W., Niu, Z., Zeng, X., Li, J. and Wang, J., 2022. Geometry-Based Molecular Generation With Deep Constrained Variational Autoencoder. IEEE Transactions on Neural Networks and Learning Systems.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-03-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
图像处理
图像处理基于腾讯云深度学习等人工智能技术,提供综合性的图像优化处理服务,包括图像质量评估、图像清晰度增强、图像智能裁剪等。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档