前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【机器学习】ATSE:利用注意力机制图神经网络结合多肽的结构和共进化信息预测其毒性

【机器学习】ATSE:利用注意力机制图神经网络结合多肽的结构和共进化信息预测其毒性

作者头像
DrugSci
发布2021-04-22 16:14:25
7350
发布2021-04-22 16:14:25
举报
文章被收录于专栏:FindKeyFindKey

——前言——

多肽类药物目前已经成为制药界和科学界重点关注的一类非常有前途的疾病治疗药物。目前,对于多肽毒性分析关注很少,基于安全性和监管目的,分析肽类毒性非常重要。随着候选肽数据的激增,以湿实验为手段的方法确定肽类毒性的实验耗时昂贵,随着数据的积累,很多课题组开发了区分有毒和无毒肽表征的机器学习算法。而这些方法大部分是基于序列表征,而忽略了结构和共进化的信息。整合这些信息可能能够对多肽类毒性预测提供更多帮助。为此Lesong Wei(日本Tsukuba大学)等人开发了一种深度学习方法ATSE,该方法能够很好地区分有毒和无毒肽,相应成果于近期发表在Briefings in Bioinformatics。对于结构信息,作者用图神经网络来逐层抓取多肽的分子图特征。至于共进化信息,作者整合了CNN和BiLSTM来学习高阶隐含的共进化特征。通过注意力机制,作者将这些共进化信息和结构信息进行对应整合。该方法在benchmark上表现出极好的预测效果,并且这些学到的特征能够很好地可视化和可解释化。此外作者还提供了一个webserver供用户分析使用(http://server.malab.cn/ATSE)。

——方法和材料——

数据集:

作者从三个公共数据库ConoServer,ArachnoServer,和SwissProt收集了长度为10~50个残基的多肽,通过初筛删除部分重复的多肽后共获取了3992个有毒和7009个无毒。考虑到序列同源性,作者使用CD-HIT程序进一步筛除同源性在90%以上的序列,最终获得1932个有毒肽。为了保证数据平衡性,作者在无毒肽中随机选取了1932个样本。这3864个样本又被随机选取85%作为训练集,剩下15%作为测试。为了避免随机划分,作者重复20次随机选取。

——ATSE网络框架——

图1

序列模块,主要通过rdkit来获取分子图G(V,E)表示,其中V表示节点,代表每个原子,E表示边,代表键。PSSM由PSI-BLAST生成得到进化谱。

由于图神经网络输入不能识别rdkit直接得到的分子图,作者采用了一个嵌入层,即引入了一个一维的Weisfeiler-Lehmanalgorithm (1-WL) 。具体做法是通过公式(2)和(3)来更新节点和边的信息。

由(2)式可以看出,作者考虑了在t次迭代中影响v节点的信息:t-1时刻v节点的信息,t-1时刻v节点周围邻居节点信息,以及t-1时刻v节点邻边信息。由(3)式可以看出,影响t时刻(u,v)边信息:t-1时刻(u,v)边信息,t时刻u节点信息,t时刻u邻居节点信息。然后就可以获取一个X嵌入矩阵,维度是n*m。随后就可以喂给GNN。

至于CNN-BiLSTM提取PSSM信息,作者考虑到局部信息用CNN获取,长程信息用BiLSTM获取。此外dropout也被用来防止过拟合。

随后,作者将两种方法获得的特征进行拼接,然后利用注意力机制进行加权重新分配。最后利用softmax获取分类概率。

——结果比较分析——

其中only-部分是作者自己构建,作者发现共进化信息相比结构信息更有用,而将二者整合,性能进一步提升。

作者还做了一些超参数的设置,如GNN层数设置对结果的影响。利用其它的分类器来评估手工提取的5个特征和作者使用的特征对预测性能的比较。提供6种特征可视化聚类效果等。

——结论——

提出了一种多肽毒性预测器ATSE,该预测器综合利用了结构和序列共进化信息,和现有的方法比起来其性能达到最佳。并且比手动提取的特征比起来,ATSE判别性能更好。

参考文献

Wei, Lesong, et al. "ATSE: a peptide toxicity predictor by exploiting structural and evolutionary information based on graph neural network and attention mechanism." Briefings in Bioinformatics (2021).


点击左下角的"阅读原文"即可查看原文章。


作者:刘佳乐

审稿:林康杰

编辑:卞薇洁

GoDesign

ID:Molecular_Design_Lab

( 扫描下方二维码可以订阅哦!)

本文为GoDesign原创编译,如需转载,请在公众号后台留言。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-04-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 FindKey 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档