前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >全转录组的测序和芯片技术

全转录组的测序和芯片技术

作者头像
生信技能树
发布2022-06-08 20:17:06
8120
发布2022-06-08 20:17:06
举报
文章被收录于专栏:生信技能树生信技能树

全转录组的数据分析我们一直没有分享过笔记,因为确实也没有这方面直接项目机会,仅仅是跟公众号粉丝交流过一些小问题。全转录组不是全长转录组,全转录组说的是检测普通mRNA,加上 lncRNA,miRNA,CircRNA这样的3种常规 非编码基因,而全长转录组说的是测序的时候采取三代测序等技术这样可以把基因的转录产物的全部长度的碱基一次性测序到,这样很方便知道不同可变剪切转录本的区别。

那,为什么我们很少涉及到全转录组的数据分析,主要是因为它有 lncRNA,miRNA,CircRNA这样的3种常规 非编码基因,而众所周知,非编码基因的名声比较差,都知道很重要,但是它的重要性又不是直接证据,也没有系统性的go和kegg等生物学数据库的整理,所以大家研究它和交流它的时候通常是一个符号而已。

但无论是普通mRNA,还是 lncRNA,miRNA,CircRNA这样的3种常规 非编码基因,它们最后都是会得到表达量矩阵,其实就是常规差异分析啦,相关流程的公众号推文在:

如果是普通mRNA可以直接去映射到go和kegg等生物学数据库,如果是非编码基因需要先定位到它的靶基因,然后去给靶基因进行go和kegg等生物学数据库注释。

全转录组的测序

比如NPJ Breast Cancer . 2021 Dec 的文章:《Plasma extracellular vesicle long RNA profiles in the diagnosis and prediction of treatment response for breast cancer 》,是两个队列的全转录组的测序:

  • 队列1:纳入患者172例,包括乳腺癌患者112例、乳腺良性疾病患者19例和健康对照组41例。(肿瘤诊断模型)
  • 队列2:纳入接受新辅助治疗的患者58例,pCR(病理完全缓解)组24例,non-pCR组34例。(疗效预测模型)

其转录组测序在 https://ngdc.cncb.ac.cn/gsa-human/browse/HRA001985 ,可以看到:

转录组测序

虽然文章写的是对172例入组患者的血浆样本进行exLR测序(exLR-seq),发现良性组和乳腺癌组中的mRNAs、lncRNAs、假基因和circRNA较健康组丰富。

这个文章里面的每个样品的测序数据量并不多,就是常规的mRNA的转录组测序的数据量, 它并没有专门的去针对每个样品进行检测普通mRNA,加上 lncRNA,miRNA,CircRNA这样的3种常规 非编码基因得到独立的fastq文件。

所以我们把目光转到另外两个《Molecular Cancer》杂志的文章;

  • 《 circPARD3 drives malignant progression and chemoresistance of laryngeal squamous cell carcinoma by inhibiting autophagy through the PRKCI-Akt-mTOR pathway 》
  • 《Circular RNA circCORO1C promotes laryngeal squamous cell carcinoma progression by modulating the let-7c-5p/PBX3 axis》

这个是真正的全转录组学测序及数据分析,喉鳞癌(LSCC)和 ANM(癌旁正常黏膜) 组织的两个分组,可以获得差异表达的miRNA、circRNA、lncRNA、mRNA,预测关键分子主要参与的信号通路及生物学过程。

全转录组的芯片

我记得2019年讨论的全转录组学测序及数据分析还是8000一个样品,因为要获得差异表达的miRNA、circRNA、lncRNA、mRNA的4种信息,还得关联分析。目前(2022)应该是不到4000一个全转录组学测序及数据分析样品了,但是全转录组学信息获得并不是只有测序这个手段,另外一个比较成熟的商业解决方案就是芯片技术,比如 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE175962

  • GPL20712 Agilent-070156 Human miRNA [miRNA version]
  • GPL21825 074301 Arraystar Human CircRNA microarray V2
  • GPL26963 Agilent-085982 Arraystar human lncRNA V5 microarray

它就有3款芯片,组合起来也算是全转录组啦。只不过是Agilent的芯片数据分析起来比较麻烦。

学徒作业

下载上面提到的GSE175962数据集的3个芯片表达量矩阵, 各自独立差异分析后,参考上面提到的两个《Molecular Cancer》杂志的文章对差异表达的miRNA、circRNA、lncRNA、mRNA的关联分析,出几个网络图。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-04-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 全转录组的测序
    • 全转录组的芯片
    • 学徒作业
    相关产品与服务
    数据库
    云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档