专栏首页智能生信【Briefings in Bioinformatics】四篇好文简读-专题2

【Briefings in Bioinformatics】四篇好文简读-专题2

论文题目:

Different molecular enumeration inf luences in deep learning: an example using aqueous solubility

论文摘要:

准确预测溶解度非常重要,但即使使用现代的计算算法也是具有挑战性的。目前,基于指纹、基于特征和基于分子图的表征都被用于不同的深度学习方法来预测水溶性,这已经清楚地表明,不同的分子表征会影响模型的预测和解释能力。在这篇文章中作者总结了不同的分子表示法,并重点讨论了如何使用图形和线性符号进行建模。作者在使用SMILES表示分子时,建议使用完整的列举来获得更好的准确性,因为SMILES的全面列举可以改善分子的表现形式,并以所有可能的角度描述分子。另外,传统上很难用神经网络来解释化学子结构对单一属性的贡献,而作者在文中展示了在解码网络中使用注意力来检测分子中与溶解度有关的部分,这可以用来解释CNN的贡献。

论文链接:

https://academic.oup.com/bib/article/22/3/bbaa092/5851267?searchresult=1

Github链接:

https://github.com/titanda/Learn-it-all

论文题目

PHIAF: prediction of phage-host interactions withGAN-based data augmentation and sequence-based feature fusion

论文摘要

这篇文章主要介绍了一种用于识别噬菌体与宿主相互作用的模型(PHIAF),本文提出了一种基于生成对抗网络(generative adversarial network, GAN)的数据增强和基于序列的特征融合(PHIAF)的PHI预测方法。首先,PHIAF采用基于gan的数据增强模块,生成伪phif来缓解数据的稀缺性。其次,PHIAF融合了源自DNA和蛋白质序列的特征,以获得更好的性能。第三,PHIAF利用注意机制考虑DNA/蛋白质序列衍生特征的不同贡献,这也提供了预测模型的可解释性。PHIAF是一种很有前景的工具,可以加速噬菌体治疗的探索。

论文链接

https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbab348/6362109

论文题目:

MG-BERT: leveraging unsupervised atomic representation learning for molecular property prediction

论文摘要:

动机:准确而有效地预测分子性质是药物设计和发现的基本问题。传统的基于特征工程的方法在特征设计和选择过程中需要大量的专业知识。人工智能模型虽然有着无与伦比的优势,但当应用于分子特性预测时,通常受到标记数据稀缺的影响,并显示出较差的概括能力。

结果:在这项研究中,作者提出了分子图BERT(MG-BERT),该模型将图神经网络的局部消息传递机制整合到强大的BERT模型中,从而使模型可以从分子图中学习。此外,作者还提出了一种有效的自我监督学习策略,即屏蔽原子预测,该策略在大量的未标记数据上预训练MG-BERT模型,来挖掘分子中的上下文信息。作者发现MG-BERT模型在预训练后可以生成上下文敏感的原子表征,并将学到的知识转移到各种分子特性的预测中。实验结果表明,经过预训练的MG-BERT模型,只要稍加微调,就能在11个ADMET数据集上超越最先进的方法。此外,MG-BERT模型还利用注意力机制来关注对目标属性重要的原子特征,为训练后的模型提供了可解释性。

论文链接:

https://academic.oup.com/bib/advance-article-abstract/doi/10.1093/bib/bbab152/6265201?redirectedFrom=fulltext

Github链接:

https://github.com/zhang-xuan1314/Molecular-graph-BERT

论文题目:

Mol2Context-vec: learning molecular representation from context awareness for drug discovery

论文摘要:

随着蛋白质组学的快速发展和药物作用靶点分子的迅速增加,计算机辅助药物设计的关键挑战成了分子表达,高质量的分子表达有助于促进药物发现。目前,分子表达仍然面临着几个亟待解决的问题,如子结构的多义性和原子团之间信息的不平滑性。在这项研究中,作者提出了一个深度情境化的Bi-LSTM架构,Mol2Context-vec,它可以整合不同层次的内部状态,使分子子结构可以动态的表示。采用该模型得到的分子上下文表示可以捕捉任何原子组之间的相互作用,特别是一对拓扑上相距甚远的原子组。此外,Mol2Context-vec的视觉解释非常接近于人类所理解的化学分子的结构特性。

论文链接:

https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbab317/6357185?searchresult=1

Github链接:

https://github.com/lol88/Mol2Context-vec


本文分享自微信公众号 - 智能生信(gh_cb6c4859dc2a),作者:智能生信

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-09-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【Briefings in Bioinformatics】四篇好文简读-专题12

    Dissecting and predicting different types of binding sites in nucleic acids base...

    智能生信
  • 【Briefings in Bioinformatics】四篇好文简读-专题11

    Subtype-WESLR: identifying cancer subtype with weighted ensemble sparse latent r...

    智能生信
  • 【Briefings in Bioinformatics】四篇好文简读-专题1

    Deep fusion learning facilitates anatomical therapeutic chemical recognition in ...

    智能生信
  • 【Bioinformatics】四篇好文简读-专题2

    Multi-omics data integration by generative adversarial network

    智能生信
  • 【Bioinformatics】四篇好文简读-专题6

    FraGAT: a fragment-oriented multi-scale graph attention model for molecular prop...

    智能生信
  • 【Bioinformatics】四篇好文简读-专题4

    MultiDTI: drug–target interaction prediction based on multi-modal representation...

    智能生信
  • 【Bioinformatics】四篇好文简读-专题5

    Highly accurate classification of chest radiographic reports using a deep learni...

    智能生信
  • 【Bioinformatics】四篇好文简读-专题1

    Subtype-GAN: a deep learning approach for integrative cancer subtyping of multi-...

    智能生信
  • 【Nature communications】四篇好文简读-专题2

    scGNN is a novel graph neural network framework for single-cell RNA-Seq analyses...

    智能生信
  • 【IJCAI 2021】四篇好文简读-专题2

    Contrastive Losses and Solution Caching for Predict-and-Optimize

    智能生信
  • 【AAAI 2021】四篇好文简读-专题2

    PSSM-Distil: Protein Secondary Structure Prediction (PSSP) on Low-Quality PSSM b...

    智能生信
  • 【Nucleic Acids Research】四篇好文简读-专题2

    Evidence in disease and non-disease contexts that nonsense mutations cause alter...

    智能生信
  • [Nature Machine Intelligence]四篇好文简读-专题1

    Improved protein structure prediction by deep learning irrespective of co-evolut...

    智能生信
  • [AAAI 2021]四篇好文简读-专题4

    Self-Attention Attribution: Interpreting Information Interactions Inside Transfo...

    智能生信
  • [Nature Methods]四篇好文简读-专题1

    SnapHiC: a computational pipeline to identify chromatin loops from single-cell H...

    智能生信
  • [Nature communications]四篇好文简读-专题3

    Genome-wide detection of cytosine methylations in plant from Nanopore data using...

    智能生信
  • Survey | 深度学习方法在生物网络中的应用

    今天介绍厦门大学刘向荣老师团队在Briefings in Bioinformatics上发表的一篇综述论文,该论文首先介绍了应用在网络数据上的深度学习几种典型的...

    DrugAI
  • 【Nature communications】四篇好文简读-专题1

    Structure-based protein function prediction using graph convolutional networks i...

    智能生信
  • 【Genome Research】四篇好文简读-专题1

    Subgenomic RNA identification in SARS-CoV-2 genomic sequencing data 论文摘要:

    智能生信

扫码关注云+社区

领取腾讯云代金券