下面是100个lncRNA组装案例文献分享
标题:应用RNA测序对鸡类肌内前脂肪细胞的分化过程中长非编码RNA和mRNA的分析
供稿:张志超
杂志:PLOS one (2017)
通讯:Jinyu Wang 扬州大学动物科技学院;江苏省安永动物遗传育种繁育与分子设计实验室
摘要:
本研究在不同分化阶段的鸡肌肉前脂肪细胞中鉴定lncRNA,12个样本中共获得25,435个lncRNA。共鉴定到7,433个差异表达基因(4,698个lncRNAs和2,735个mRNAs)。通过K-Means聚类,这7433个差异表达基因根据其表达模式被分成11个簇。利用加权基因共表达(WGCNA)网络分析,我们发现了4个与I0、I2、I4和I6期呈正相关的阶段特异性模块和2个与I0和I2期呈负相关的阶段特异性模块。许多已知的和新的与肌肉内前脂肪细胞分化相关的途径被鉴定出来。我们还在每个阶段特定的模块中识别了HUB基因,并在Cytoscape中对它们进行了可视化。我们的分析发现了许多高度相关的基因,包括XLOC_058593、BMP3、MYOD1和LAMP3。本研究为鸡LncRNA的研究提供了有价值的资源,加深了我们对鸡前脂肪细胞分化生物学的认识。
背景知识:
为了更快的生长和提高饲料转化效率而进行的基因选择,鸡肉的质量和风味都有所下降。
研究表明,鸡肉中,肌内脂肪(IMF)含量与多种肉质细胞有关。IMF水平主要由分布在肌纤维间的脂肪细胞的增生和肥大决定。
脂肪形成是一个受多种转录事件调控的复杂过程。在哺乳动物中,肌内前脂肪细胞的分化已经得到了很好的研究,特别是在牛和猪身上。先前的研究证实FTO、GPR39、myostatin、microRNA-143、PPARG、FABP4和Lipe在猪和牛的肌内前脂肪细胞分化和肌内脂肪沉积的调节中起关键作用。然而,对鸡肌肉内脂肪沉积的调控机制却知之甚少。到目前为止,只有几个基因被确认与肌内脂肪沉积有关,如H-FABP、A-FABP、FAT/CD36和adiponectin。
之前的研究表明,lncRNA影响腹部和皮下前脂肪细胞的分化。然而,这些研究主要集中在腹部和皮下前脂肪细胞,对lncRNAs在肌内前脂肪细胞分化中的作用和意义知之甚少。该研究利用RNA-seq技术研究了静海黄鸡分化第0、2、4、6天肌肉前脂肪细胞中lncRNAs和mRNAs的表达谱。
实验设计:

项目数据编号是SRP080792, 包括 I0、I2、I4、I6四个时期,每个时期三个重复。,如下所示的样品信息 :

image-20210519111235222
数据方法
Gallus gallus reference genome (gal4)
这个基本上是测序公司就会自动给大家提供的测序结果和质量控制表格。每个样品都是接近1个亿的reads数量,非常的充足啦,比对率高达80%,对鸡这个物种来说也非常棒。
12个肌肉前脂肪样本中共获得25435个新的lncRNA ,具体鉴定流程后面详解;

LncRNAs的开放阅读框长度主要在20~100bp之间,而且外显子数量基本上都是1个。可以看到,lncRNAs的序列长度和开放阅读框长度都比mRNAs短,外显子数也较少。
大量lncRNA的功能是未知的,但是它们主要是cis-regulators,所以可以根据它们临近的蛋白编码基因功能来近似推断,然后表达量的相关性也可以类推到。
文章进行了如下所示的两个推断:

通过顺式功能预测确定了20116个lncRNAs的11398个靶基因,通过互补结合预测确定了479个lncRNAs的365个靶基因。**对靶基因进行GO和KEGG.
主要富集的通路有:转化生长因子-β信号通路、丝裂原活化蛋白激酶信号通路和肌动蛋白细胞骨架调节通路,蛋白质消化吸收、肥厚性心肌病(HCM)和造血细胞系。
转录组的标准分析,比较容易复现,基本上看我六年前的表达芯片的公共数据库挖掘系列推文即可;
以q-value<0.05和fold change ≥2为标准,通过对分化第0、2、4和6天的前脂肪细胞样本进行成对比较(I0对I2,I0对I4,I0对I6,I2对I4,I2对I6),获得4698个差异表达的lncRNA和2735个差异表达的mRNA(已知蛋白编码基因)。
通过同一样本的配对比较(I0对I2,I2对I4,I4对I6),总共获得了3200个差异表达的lncRNA和1608个差异表达的mRNA。如图4所示,43个差异表达基因在四个比较(3个lncRNAs和40mRNAs)中是共同的。

唯一值得一提的是,基因的聚类分群,也有专门的R包可以做,大家可以去搜索关键词:转录组的时间序列分析,如下所示:

image-20210521105506743
绘制了11个聚类图,可以分成6个主要簇。
生信技能树多个教程分享WGCNA的实战细节,见:
其他:
这个文章是使用WGCNA来预测lncRNA的靶基因。在此分析之前,剔除了同一组中多个样本中低表达水平的差异表达基因(FPKM≤0.05)。最后,保留2510个差异表达基因(379个lncRNAs和2131个mRNAs)并进行共表达分析。共有419个mRNAs与94个lncRNAs具有共同的表达模式。共鉴定出8个模块。

基因分成了模块,就可以去跟性状进行各种各样的关联分析:

GS:基因与分化阶段的相关性;MM:模块特征基因与表达皮的相关性。
最终确定了6个阶段特定的模块。
其中绿色、黄色和浅青模块与I0和I2成负相关。在分化的第0天和第2天,绿色、黄色和淡青色模块中基因的表达水平(ME)明显下调。相反,深绿色、蓝色、黑色和深橙色的模块分别与I0、I2、I4和I6期呈正相关,这些模块中的基因表达在分化的第0、2、4和6天显著上调。
64个基因(7个lncRNAs和57mRNAs)在整个分化过程中均有差异表达,提示它们在肌内前脂肪细胞分化中起重要作用。MYOD1就是一个例子,它是MyoD基因家族的成员,据报道它可以促进棕色脂肪组织的发育。

与前脂肪细胞分化相关的基因有IGFBP2、Ex-FABP、MYOD1和BMP3,在鸡肌肉内前脂肪细胞分化过程中的研究还是首次报道。
已鉴定出许多高度相关的lncRNA,包括xloc_040491、xloc_029050和xloc_057619,它们可能在它们特定的分化阶段中发挥关键作用。
关于 HUB基因的鉴定与可视化 就不得不提我们的cytoscape课程啦,免费发布在b站哦,欢迎前往学习:

本研究 通过对肌内前脂肪细胞分化I0、I2、I4、I6进行研究,筛选调控鸡肌内前脂肪细胞分化的lncRNAs和mRNAs。
lncRNAs可能通过相邻或互补的靶基因发挥作用,在鸡肌内前脂肪细胞的分化过程中起着关键作用。
64个基因(7个lncRNAs和57mRNAs)在整个分化过程中均有差异表达,提示它们在肌内前脂肪细胞分化中起重要作用。
通过WGCNA,鉴定到与肌内前体脂肪细胞发育的HUB基因。