小贴士
非编码RNA(ncRNA)是一组缺乏蛋白编码的内源RNA,分为小RNA和长链非编码RNA(lncRNA)。之前的研究多关注蛋白编码基因,对ncRNA功能知之甚少,甚至称其为转录“噪音”。然而,近年来的研究发现,ncRNA在多个生物学过程中起着重要的作用。自ncRNA概念提出以来,该领域就成为研究热点,而关于长链非编码RNA(lncRNA)的研究则是ncRNA研究的重点,相关的研究文章也在近年呈现爆发性的增长。下面就一起浏览一下近期都有哪些相关的报道吧:
1
Genes : 鉴定有助于组织特异性长链非RNA表达的转座因子
近来有研究已经提出,转座因子(TEs)被重新用作长链非编码RNA(lncRNA)的功能元件。这一说法获得了一些案例支持,例如人内源性逆转录病毒亚家族H(HERVH)元件中包含lncRNAs,并在人胚胎干细胞(hESCs)中特异性表达,是维持hESC同一性必需的。目前,至少有两个关于lncRNA暂未解答的问题。有多少个包含lncRNA的TEs被重新使用?有没有其他的TEs影响组织特异性lncRNA的表达?
为了回答这些问题,早稻田大学的研究人员综合确定了与组织特异性lncRNAs表达水平显著相关的TEs。他们从Expression Atlas下载了对应于正常人组织的lncRNA表达数据,并将其转换成组织特异性估值。然后,进行了费希尔精确检验以验证TE衍生序列的存在与否是否影响lncRNA表达的组织特异性。许多与组织特异性lncRNA表达相关的TE组织都被检测到,表明多个TE家族可以重新用作lncRNA的功能结构域或调控序列。研究人员还发现,L1PA2的一个LINE-1亚家族的反义启动子区似乎是胎盘特异性表达 lncRNA的启动子。
图1 分析流程图
2
Sci Rep :UClncR—从RNA-seq数据中快速,全面的检测长链非编码RNA
长链非编码RNA(lncRNA)是近年来发现的具有调节功能的一类基因转录物。预计还会有更多的来自不同类型的正常和患病组织的RNA-seq数据的积累。然而,从大量的RNA-seq数据中发现新的lncRNAs并准确定量已知的lncRNAs并不是微不足道的。
梅奥医学中心的研究人员开发了快速和全面检测lncRNA的渠道——UClncR来应对这一挑战。 UClncR采用标准的RNA-seq比对文件,进行转录本组装,预测候选lncRNA,定量和注释已知及新的候选lncRNA,并为下游分析生成便捷的报告。这个方法可以容纳un-stranded和stranded RNA-seq,从而可以预测和定量lncRNAs与其他基因的重叠。UClncR在集群环境中完全并行化,并且允许用户在没有集群的情况下依次分析样本。该方法可以在几分钟内处理典型的RNA-seq样品,并在数小时内完成数百个样品。对两个测试数据集lncRNA的预测分析证实了UClncR的准确性及其与样品临床表型的相关性。
图2 UClncR工作流程图
3
Blood Adv :用于预测成人骨髓增生异常综合征的4-lncRNA评分系统
长链非编码RNAs(lncRNAs)不仅参与了正常的造血过程,而且还参与了急性白血病的发病机制。然而,它们在骨髓增生异常综合征(MDS)中的临床和预后相关性至今仍不清楚。
在这项研究中,来自中国台湾大学医院的研究人员对176例成人原发性MDS患者的lncRNA表达进行了分析,发现4个lncRNA的表达水平与总生存期(OS)显著相关。然后他们用这4个lncRNAs的加权总和构建了一个风险评分系统。更高的lncRNA评分与更高的骨髓原始细胞百分比,更高风险的MDS亚型(基于修订的国际预后评分系统[IPSS-R]和世界卫生组织分类),复杂的细胞遗传学改变以及RUNX1,ASXL1, TP53,SRSF2和ZRSR2相关,而它们与SF3B1突变呈负相关。具有较高lncRNA评分的患者的OS显著更短,并且5年白血病转化率高于具有较低评分的患者。
4-lncRNA风险评分的预后意义可以在独立的MDS队列中验证。在多变量分析中,无论年龄,细胞遗传学,IPSS-R和基因突变如何,较高的lncRNA评分仍然是OS独立的危险因素(相对危险度,4.783;P
图3 评分系统工作流程
4
Bioinformatics :通过分层多标签分类对lncRNAs进行GO功能注释
长链非编码RNAs(lncRNAs)是功能性非编码RNA的巨大集合。在过去的几十年中,已经鉴定了大量新的lncRNA基因。然而,大多数lncRNAs功能目前仍然未知。计算方法为理解lncRNAs潜在的功能影响提供了新的见解。
考虑到每个lncRNA可能具有多种功能,并且某种功能可以进一步专门化为子功能,在这里中南大学的研究人员描述了NeuraNetL2GO,一种基于多个神经网络的分层多标签分类策略的lncRNAs计算本体函数预测方法。神经网络逐级训练,每个神经网络预测给定水平基因的GO功能。在NeuraNetL2GO中,研究者使用lncRNA相似性网络的拓扑特征作为神经网络的输入,并且使用输出结果来注释lncRNAs。他们表示,NeuraNetL2GO与其他方法相比,在手动注释的lncRNA2GO-55数据集最大的F-measure和覆盖范围上获得了很好的性能和总体优势。
图 NeuraNetL2GO流程图
5
BMC Bioinformatics :一种用于鉴定和表征保守lncRNAs的通用方法
长链非编码RNA(lncRNAs)参与多种生物学过程,并在各种人类疾病中起重要作用。由于RNA测序(RNA-Seq)技术的兴起,鉴定出的lncRNAs数量近年来迅速增加。然而,目前大多数lncRNAs没有很好的表征,其调控机制仍然难以捉摸。许多lncRNAs表现出较差的进化保守性。因此,跨物种保守的lncRNAs对其关键功能作用的研究非常重要。
本研究中,研究人员对人和大鼠脑组织中的lncRNAs进行了直向同源分析。分析了来自80个人和66个大鼠脑组织样品的超过20亿个RNA-Seqreads。他们的分析显示共有351个保守的人类lncRNAs对应于646个大鼠lncRNAs。在这些人类lncRNAs中,140个是本研究新鉴定的,246个存在于已知的lncRNA数据库中;然而,已鉴定的大多数lncRNAs尚未进行功能注释。研究人员基于保守的人类lncRNAs和蛋白质编码基因的表达谱构建了共表达网络,并产生了79个共表达模块。共表达模块基因的GO分析表明,保守的lncRNAs参与脑发育,神经系统发育和大脑皮质发育。他们进一步预测了lncRNAs和蛋白质编码基因之间的相互作用,以更好地理解lncRNAs的调控机制。此外,他们调查了大鼠脑发育过程中不同时间点保守lncRNAs的表达模式。研究人员发现,四个这样的lncRNA基因中的三个的表达水平从第2周到第104周不断增加,这与它们的功能注释一致。
人类和大鼠脑组织中的lncRNAs的直向同源分析揭示了一组保守的lncRNAs。进一步的表达分析提供了这些lncRNAs在人类和大鼠中的功能注释。这些结果为开发更好的实验调查lncRNAs的分子调控机制以及lncRNAs在脑发育中的作用提供了新的目标。另外,这种方法可以推广到研究和表征在其他物种和组织类型中保守的lncRNAs。
参考文献
1.Chishima T, Iwakiri J, Hamada M. (2018)Identification of Transposable Elements Contributing to Tissue-SpecificExpression of Long Non-Coding RNAs. Genes (Basel) 9(1).
2.Sun Z, Nair A, Chen X, Prodduturi N, Wang J,Kocher JP. (2017) UClncR: Ultrafast and comprehensive long non-coding RNAdetection from RNA-seq. Sci Rep 7(1):14196.
3.Yao CY, Chen CH, Huang HH, Hou HA, Lin CC,Tseng MH, Kao CJ, Lu TP, Chou WC, Tien HF. (2017) A 4-lncRNA scoring system forprognostication of adult myelodysplastic syndromes. Blood Adv 1(19):1505-1516.
4.Zhang J, Zhang Z, Wang Z, Liu Y, Deng L.(2017) Ontological function annotation of long non-coding RNAs throughhierarchical multi-label classification. Bioinformatics [Epub ahead of print].
5.Li D, Yang MQ. (2017) Identification andcharacterization of conserved lncRNAs in human and rat brain. BMCBioinformatics 18(Suppl 14):489.
本周lncRNA相关报道就讲到这里了,下期见~
如需讨论,欢迎留言给小编~
ncRNA研究推荐
领取专属 10元无门槛券
私享最新 技术干货