前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【Briefings in Bioinformatics】四篇好文简读-专题12

【Briefings in Bioinformatics】四篇好文简读-专题12

作者头像
智能生信
发布2021-10-20 16:35:10
3700
发布2021-10-20 16:35:10
举报
文章被收录于专栏:智能生信智能生信

论文题目

Dissecting and predicting different types of binding sites in nucleic acids based on structural information

论文摘要

DNA和RNA的生物学功能一般依赖于它们与其他分子的相互作用,如小配体、蛋白质和核酸。然而,我们对不同相互作用对的核酸结合位点的了解非常有限,识别这些关键的结合区域并非易事。在此,文章对这两类核酸中结合位点和非结合位点以及不同类型的结合位点进行了综合比较。从结构上看,RNA可以通过形成结合袋与配体相互作用,利用突出的表面与蛋白质和核酸接触,而DNA则可以通过靠近链中部的区域与其他分子接触。基于结构信息,充分利用不同机器学习算法、特征空间和样本空间之间的相互作用,建立基于特征的集成学习分类器来识别结合位点。同时,利用结构守恒设计了一个基于模板的分类器。这两个分类器之间的互补性帮助建立了一个综合的框架来提高预测性能。此外,文章还利用基于随机游走算法的处理过程进一步校正综合预测。统一的预测框架为不同的结合位点提供了良好的结果,并优于现有的方法。

论文链接

https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbab411/6384399

论文题目:

Locating transcription factor binding sites by fully convolutional neural network 论文摘要:

转录因子(TFs)在调控基因表达方面发挥着重要作用,因此识别它们所结合的区域已经成为分子和细胞生物学的一个基本步骤。近年来,越来越多的基于深度学习(DL)的方法被提出用于预测TF结合位点(TFBSs),并取得了优异的预测性能。然而,这些方法主要集中在预测TF-DNA结合的序列特异性上,相当于一个序列级的二元分类任务,而不能准确地识别motifs和TFBSs。在本文中,作者开发了一个全卷积网络加上全局平均池(FCNA),它相当于一个核苷酸水平的二元分类任务,可以定位TFBSs并准确识别motifs。在ChIP-seq数据集上的实验结果表明,FCNA明显优于其他竞争性方法。此外,通过FCNA定位的区域可以被进一步完善预测性能,且可以准确地识别不同细胞系的TF-DNA结合,并推断出TF-DNA的间接结合关系。

论文链接:

https://academic.oup.com/bib/article/22/5/bbaa435/6120268?searchresult=1 Github链接:

https://github.com/turningpoint1988/FCNA

论文题目

Integration of pairwise neighbor topologies and miRNA family and cluster attributes for miRNA–disease association prediction

论文摘要

识别疾病相关的miRNAs有助于了解疾病的发病机制。现有的研究方法是通过整合多种与miRNA和疾病相关的数据来推断与疾病相关的候选miRNA。然而,miRNA节点的属性,包括其家族和集群归属信息,尚未被深入整合。此外,学习一对miRNA与疾病的邻居拓扑表示也是一个具有挑战性的问题。文章提出了一种疾病相关miRNA预测方法,通过编码和整合从生成和对抗的角度学习到的miRNA和疾病节点的多种表示。首先构建了一个miRNA与疾病节点的双层异构网络,其中包含了这些节点之间的多种连接类型,这些连接类型反映了miRNA-疾病对的邻居拓扑结构,以及miRNA节点的属性,特别是miRNA相关的家族和簇。学习增强的成对邻居拓扑,提出了一个生成和对抗模型,带有基于卷积自编码器的生成器来编码miRNA-疾病对的低维拓扑表示,以及基于多层卷积神经网络的鉴别器来区分真邻居和假邻居拓扑嵌入。此外,文章设计了一种新的特征类别注意机制,以学习不同特征的不同重要性,最终进行自适应融合和预测。与5种miRNA-疾病关联方法的比较结果表明,文章的模型可以在排名靠前的候选基因中发现更多实际的miRNA与疾病的关联。

论文链接

https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbab428/6385813

论文题目

ZoomQA: residue-level protein model accuracy estimation with machine learning on sequential and 3D structural features

论文摘要

模型精度估计问题是生物信息学领域的基石问题。在CASP14中,有79种全局的QA方法,以及39种残渣级QA方法中的少数,其中很少的方法用于蛋白质复合物。文章介绍了ZoomQA,一个新的单模型的方法来评估准确度的三级蛋白质结构/复合物的残留水平。ZoomQA与其他方法的不同之处在于,它考虑的是随着接触半径的增加,片段结构化学和物理特征的变化。氨基酸的14种物理和化学性质被用来建立一个蛋白质中每个残基的综合代表,并对它们在整个蛋白质中的位置进行分级。此外,文章还展示了ZoomQA在识别SARS-CoV-2蛋白复合物的问题区域方面的潜力。在CASP14上对ZoomQA进行了基准测试,它在全局预测指标上优于其他最先进的QA方法。实验证明了这些新特征的有效性,并表明文章的方法能够在不使用数据库或PSSM矩阵的同源搜索的情况下匹配其他最先进的方法的性能。

论文链接

https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbab384/6374129


欢迎关注公众号,获取更多论文解读

转载或合作请联系邮箱 intbioinfo@163.com

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-10-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智能生信 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档