首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Bioinformatics|LncADeep一种基于深度学习的从头开始识别lncRNA和功能注释工具

今天给大家介绍北京大学朱怀球教授在Bioinformatics上发表的文章“LncADeep: an ab initio lncRNA identification and functional annotation tool based on deep learning”。识别lncRNAs,推断lncRNAs的功能,以及对IncRNA注释进行全面的构建是十分必要的。本文提出LncADeep是第一个不仅可以识别lncRNAs并且推断lncRNAs功能的工具,在识别lncRNA上,LncADeep集成了序列固有和同源性特征,放入深度置信网络(DBN)对全长和部分的转录本进行判别。结果表明,lncADeep的性能优于最先进的工具,并且可以跨物种IncRNA鉴定。对于功能注释,本文首先利用序列和结构信息,基于深度神经网络(DNNs)的深度学习算法预测了lncRNA的相互作用蛋白质,随后融合了KEGG和Reactome等人路径富集分析并且利用预测的相互作用蛋白进行功能模块检测,从而提供了丰富的途径和功能模块作为功能注释。

01

全长转录组 | Oxford Nanopore (ONT) 三代全长转录组分析流程 -- 数据质控和预处理

ONT全长转录组测序是指基于牛津纳米孔公司(Oxford Nanopore Technologies,ONT)三代测序平台进行的全长转录组测序。利用三代测序平台长度长 (long-read)的特性,无需对转录本进行片段化,直接获取某一物种mRNA(或者有polyA尾的lncRNA)5'端到3'端的高质量全长转录组序列信息(图1),可准确识别可变剪接、基因融合、基因家族、可选择性多聚腺苷酸化 (alternative polyadenylation, APA)、等位基因特异性表达等转录本结构方面的变异。基于ONT三代测序平台进行全长转录组测序,除了可准确鉴别上述转录本结构变异,由于现阶段测序成本和通量(相对于PacBio平台),还可实现转录本(mRNA或polyA+ lncRNA)表达水平准确定量和差异分析。

02

全长转录组 | 三代全长转录之circRNA(ONT )-- CIRI-long

目前研究表明,在生物体内,circRNA主要通过其序列特征,发挥miRNA海绵、RNA-binding proteins (RBPs)海绵以及翻译短肽等生物学功能(1-2)。因此,确定其的全长序列,是进行circRNA功能研究的重要基础。由于目前对于circRNA的研究多采用二代测序的方法,而circRNA的内部序列与线性mRNA分子高度相似,单纯通过算法(识别反向剪切位点)很难区分来自环形RNA和线性RNA分子的读段,以及确定全长circRNA内部组成。近期的研究中利用了长读长测序技术,对circRNA的全长重构进行了尝试(3-4)。因此,目前研究方法对于circRNA结构的识别能力主要被二代测序的读长所限制,对于长度较长(>500bp)的circRNA分子,仍然缺少有效的全长重构手段。

02
领券