前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【Briefings in Bioinformatics】四篇好文简读-专题2

【Briefings in Bioinformatics】四篇好文简读-专题2

作者头像
智能生信
发布2021-10-08 15:50:00
6340
发布2021-10-08 15:50:00
举报
文章被收录于专栏:智能生信智能生信

论文题目:

Different molecular enumeration inf luences in deep learning: an example using aqueous solubility

论文摘要:

准确预测溶解度非常重要,但即使使用现代的计算算法也是具有挑战性的。目前,基于指纹、基于特征和基于分子图的表征都被用于不同的深度学习方法来预测水溶性,这已经清楚地表明,不同的分子表征会影响模型的预测和解释能力。在这篇文章中作者总结了不同的分子表示法,并重点讨论了如何使用图形和线性符号进行建模。作者在使用SMILES表示分子时,建议使用完整的列举来获得更好的准确性,因为SMILES的全面列举可以改善分子的表现形式,并以所有可能的角度描述分子。另外,传统上很难用神经网络来解释化学子结构对单一属性的贡献,而作者在文中展示了在解码网络中使用注意力来检测分子中与溶解度有关的部分,这可以用来解释CNN的贡献。

论文链接:

https://academic.oup.com/bib/article/22/3/bbaa092/5851267?searchresult=1

Github链接:

https://github.com/titanda/Learn-it-all

论文题目

PHIAF: prediction of phage-host interactions withGAN-based data augmentation and sequence-based feature fusion

论文摘要

这篇文章主要介绍了一种用于识别噬菌体与宿主相互作用的模型(PHIAF),本文提出了一种基于生成对抗网络(generative adversarial network, GAN)的数据增强和基于序列的特征融合(PHIAF)的PHI预测方法。首先,PHIAF采用基于gan的数据增强模块,生成伪phif来缓解数据的稀缺性。其次,PHIAF融合了源自DNA和蛋白质序列的特征,以获得更好的性能。第三,PHIAF利用注意机制考虑DNA/蛋白质序列衍生特征的不同贡献,这也提供了预测模型的可解释性。PHIAF是一种很有前景的工具,可以加速噬菌体治疗的探索。

论文链接

https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbab348/6362109

论文题目:

MG-BERT: leveraging unsupervised atomic representation learning for molecular property prediction

论文摘要:

动机:准确而有效地预测分子性质是药物设计和发现的基本问题。传统的基于特征工程的方法在特征设计和选择过程中需要大量的专业知识。人工智能模型虽然有着无与伦比的优势,但当应用于分子特性预测时,通常受到标记数据稀缺的影响,并显示出较差的概括能力。

结果:在这项研究中,作者提出了分子图BERT(MG-BERT),该模型将图神经网络的局部消息传递机制整合到强大的BERT模型中,从而使模型可以从分子图中学习。此外,作者还提出了一种有效的自我监督学习策略,即屏蔽原子预测,该策略在大量的未标记数据上预训练MG-BERT模型,来挖掘分子中的上下文信息。作者发现MG-BERT模型在预训练后可以生成上下文敏感的原子表征,并将学到的知识转移到各种分子特性的预测中。实验结果表明,经过预训练的MG-BERT模型,只要稍加微调,就能在11个ADMET数据集上超越最先进的方法。此外,MG-BERT模型还利用注意力机制来关注对目标属性重要的原子特征,为训练后的模型提供了可解释性。

论文链接:

https://academic.oup.com/bib/advance-article-abstract/doi/10.1093/bib/bbab152/6265201?redirectedFrom=fulltext

Github链接:

https://github.com/zhang-xuan1314/Molecular-graph-BERT

论文题目:

Mol2Context-vec: learning molecular representation from context awareness for drug discovery

论文摘要:

随着蛋白质组学的快速发展和药物作用靶点分子的迅速增加,计算机辅助药物设计的关键挑战成了分子表达,高质量的分子表达有助于促进药物发现。目前,分子表达仍然面临着几个亟待解决的问题,如子结构的多义性和原子团之间信息的不平滑性。在这项研究中,作者提出了一个深度情境化的Bi-LSTM架构,Mol2Context-vec,它可以整合不同层次的内部状态,使分子子结构可以动态的表示。采用该模型得到的分子上下文表示可以捕捉任何原子组之间的相互作用,特别是一对拓扑上相距甚远的原子组。此外,Mol2Context-vec的视觉解释非常接近于人类所理解的化学分子的结构特性。

论文链接:

https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbab317/6357185?searchresult=1

Github链接:

https://github.com/lol88/Mol2Context-vec


本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-09-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智能生信 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档