一
论文题目:
FusionDTA: attention-based feature polymerizer and knowledge distillation for drug-target binding affinity prediction 论文摘要:
药物靶标亲和力(DTA)预测在药物发现中发挥着越来越重要的作用。目前,许多预测方法都侧重于药物和蛋白质的特征编码,而忽视了特征聚合的重要性。然而,日益复杂的编码器网络导致了隐含信息的丢失和过大的模型。为此,作者提出了一种基于深度学习的方法,即FusionDTA。针对隐含信息丢失的问题,提出了一种新的多头线性注意机制来代替粗略的集合法。这使得FusionDTA可以根据注意力权重聚合全局信息,而不是像max-pooling那样选择最大的一个。为了解决参数冗余问题,作者将知识蒸馏应用到FusionDTA中,将可学习的信息从教师模型传递给学生。结果表明,FusionDTA在所有评价指标上都优于现有的模型。在Davis和KIBA数据集中,该模型得到的一致性指数(CI) 分别为0.913和0.906,而之前最先进的模型分别为0.893和0.891。此外,知识蒸馏确实节省了模型一半的参数,CI指数仅降低了0.006。即使只有一半参数的FusionDTA也很容易超过基准方法在所有指标上。总的来说,作者提出的模型具有更好的性能,提高了药物-靶相互作用(DTI)预测的效果。在基于结构的药物设计中,DTI的可视化可以有效地帮助预测蛋白质的结合区。
论文链接:
https://doi.org/10.1093/bib/bbab506 Github:
https://github.com/yuanweining/FusionDTA
二
论文题目:
SAM-TB: a whole genome sequencing data analysis website for detection of Mycobacterium tuberculosis drug resistance and transmission 论文摘要:
全基因组测序(WGS)可以提供对耐药性、传播链和疫情识别的深入了解,但数据分析仍然是其常规临床应用的障碍。虽然已经出现了几种耐药预测工具,但到目前为止还没有网站将耐药预测与非结核分枝杆菌(NTM)的菌株遗传关系和物种鉴定结合起来。文章建立了一个免费、功能丰富、用户友好的MTB WGS数据分析在线平台(SAM-TB, http://samtb.szmbzx.com),整合了17种抗结核药物的耐药预测、变异检测、遗传关系分析和NTM物种鉴定。利用3177株测序临床分离株进行表型药敏试验(pDST),评估SAM-TB预测耐药的准确性。与pDST相比,SAM-TB检测耐多药结核病的敏感性为93.9%[95%可信区间(CI) 92.6 ~ 95.1%],特异性为96.2% (95% CI 95.2 ~ 97.1%)。SAM-TB还通过重建系统发育树和计算成对单核苷酸多态性(SNP)距离来分析多个菌株之间的遗传关系,以确定基因组群。合并后的mlstverse软件识别NTM物种的准确率为98.2%,Kraken2软件可以检测MTB和NTM混合样品。SAM-TB还具有在用户之间共享序列数据和分析的能力。SAM-TB是一个多功能的综合网站,使用WGS原始数据准确预测抗结核药物耐药谱,分析多种菌株之间的遗传关系,并识别NTM物种和同时含有NTM和MTB的混合样本。SAM-TB是指导治疗和流行病学调查的有用工具。
论文链接:
https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbac030/6535677
三
论文题目:
Accelerating the discovery of antifungal peptides using deep temporal convolutional networks 论文摘要:
机器智能在生物科学中的应用已经有了一些自动化工具的发展,从而使快速药物发现成为可能。本文中,作者提出了一种基于时间卷积网络的二元分类方法,在植物和动物的蛋白质组中发现新的抗真菌分子,以加快抗真菌药物的开发。尽管生物分子被称为抗真菌肽(AFPs),是生物体内在的宿主防御机制的一部分,但通过传统的生化程序来识别和发现它们是很困难的。同时,缺乏关于AFPs的大型数据集也是建立一个强大的自动分类器的一个相当大的障碍。为此,作者采用了迁移学习技术对抗菌肽模型进行了预训练。最后,作者建立了一个预测AFP的分类器,其准确率和精确度达到94%。分类器在很大程度上超过了几个最先进的模型。此外,作者还利用模型在有代表性的动物(Histatin)和植物(Snakin)蛋白质中确定了有效的AFPs。
论文链接:
https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbac008/6526725
四
论文题目:
Adapt-Kcr: a novel deep learning framework for accurate prediction of lysine crotonylation sites based on learning embedding features and attention architecture 论文摘要:
蛋白质赖氨酸巴豆酰化(Kcr)是一种重要的翻译后修饰类型,与广泛的生物过程有关。识别Kcr位点对于更好地理解其功能机制至关重要。然而,现有的识别Kcr位点的技术花费大效率低,因此非常需要新的计算方法来解决这个问题。文章开发了Adapt Kcr,这是一种先进的深度学习模型,它利用自适应嵌入,基于卷积神经网络以及双向长-短期记忆网络和注意结构。在独立测试集上,Adapt Kcr优于当前最先进的Kcr预测模型,准确度提高了3.2%,接收机工作特性曲线下面积提高了1.9%。与其他Kcr模型相比,Adapt Kcr还具有更强大的区分巴豆酰化和其他赖氨酸修饰的能力。另一个模型(Adaptest)被训练用于预测SARS-CoV-2中的磷酸化位点,其性能优于同等最先进的磷酸化位点预测模型。这些结果表明,自适应嵌入特征在捕获鉴别信息方面优于手工特征;当用于注意力结构时,这可能是一种识别蛋白质Kcr位点的有效方法。文章的Adapt框架(包括学习嵌入特征和注意结构)在预测其他蛋白质翻译后修饰位点方面有很大的潜力。
论文链接:
https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbac037/6533505 Github链接:
https://github.com/Marscolono/Adapt-Kcr