一论文题目:
Evaluating disease similarity based on gene network reconstruction and representation
论文摘要:
量化疾病之间的关联对于提高我们对疾病生物学的理解、改进疾病诊断、重新定位和开发药物具有重要意义。因此,近年来,疾病相似性的研究受到了生物信息学领域的广泛关注。先前的研究表明,本体论(如疾病本体论和基因本体论)与疾病-基因相互作用的结合值得被用来阐明疾病和疾病关联。然而,其中大多数要么基于疾病相关基因集之间的重叠,要么基于本体层次结构中的距离。这些方法中的疾病都是用离散或稀疏的特征向量表示的,不能把握疾病的深层语义信息。近年来,深度表征学习得到了广泛的研究,并逐渐应用于生物信息学的各个领域。基于疾病表征依赖于其相关基因表征的假设,作者提出了一种疾病表征模型,该模型利用两种最具代表性的基因资源HumanNet和Gene Ontology构建新的基因网络并学习基因(疾病)表征。两种疾病之间的相似性由其对应表示的余弦相似性计算。
论文链接:
https://academic.oup.com/bioinformatics/article/37/20/3579/6274643
二论文题目:
Deep Subspace Mutual Learning for cancer subtypes prediction 论文摘要:
准确预测肿瘤亚型对肿瘤的诊断和治疗具有重要意义。病因学复杂,存在不同的组学水平;因此,综合分析提供了一个非常有效的方法,以提高我们对癌症的认识。本文提出了一种新的计算框架——深度子空间互学习(DSML)。DSML能够通过深度神经网络同时学习每个可用组学数据和整体多组学数据的子空间结构,从而通过对多级、单级和部分组学数据的聚类,实现对子类型的预测。根据癌症基因组图谱的三个层次的组学数据,对五种不同的癌症进行了广泛的实验。实验分析表明,DSML提供了可比甚至更好的结果,比许多最先进的综合方法。
论文链接:
https://academic.oup.com/bioinformatics/article-abstract/37/21/3715/6363785?redirectedFrom=fulltext Github链接:
https://github.com/polytechnicXTT/Deep-Subspace-Mutual-Learning.git
三论文题目:
TargetNet: functional microRNA target prediction with deep neural networks
论文摘要:
MicroRNA (miRNA) 通过与信使 RNA (mRNA) 的位点结合,在基因表达调控中发挥关键作用。虽然确定 miRNA 的功能靶点至关重要,但它们的预测仍然是一个巨大的挑战。以前的算法有很大的局限性。他们使用保守的候选目标位点 (CTS) 选择标准,主要侧重于规范的位点类型,依赖费力且耗时的手动特征提取,并且没有充分利用 miRNA-CTS 相互作用的基础信息。在本文中,作者提出了 TargetNet,这是一种基于深度学习的新型功能性 miRNA 目标预测算法。为了解决以前方法的局限性,TargetNet 具有三个关键组件:(i) 放宽 CTS 选择标准以适应其不规则性,(ii) 使用新型 miRNA-CTS 序列编码方案和 (iii) 基于残差网络的预测模型。所提出的模型使用 miRNA-CTS 数据集进行训练,并使用 miRNA-mRNA 数据集进行评估。实验结果表明, TargetNet 成为用于功能性 miRNA 靶标分类的最先进算法。
论文链接:
https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btab733/6408435 Github链接:
https://github.com/mswzeus/TargetNet
四论文题目:
Virtifier: A deep learning-based identifier for viral sequences from metagenomes 论文摘要:
作者提出了一种基于深度学习的宏基因组序列病毒标识符Virtifier,它包括一个名为Seq2Vec的核苷酸序列编码器和一个带有基于注意的LSTM网络的变异病毒序列预测器,通过利用一个经过充分训练的嵌入矩阵来编码密码子,Seq2Vec可以有效提取核苷酸序列中这些密码子之间的联系。使用LSTM神经网络与注意层相结合,可以进一步分析密码子关系并筛选对最终特征有贡献的部分。三个数据集的实验结果表明,Virtifier能够准确识别短病毒序列(<500 bp),超过了三种广泛使用的方法(VirFinder、DeepVirFinder和PPR Meta),而且它在更长的长度(>5000bp)上实现了类似的性能。
论文链接:
https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btab845/6462188 Github链接:
https://github.com/crazyinter/Seq2Vec