未知的东西总是让人害怕,即使是花时间看他人做过一遍也好过踟蹰不前,请看好:
首先需要10x仪器出来的fastq数据
这个可以看前面的教程:10X genomics单细胞数据集探索列出了非常多的官网教程。
比如,最小的测试数据集,如下:
可以看到左右端测序数据大小不一致,而且每次测序是有3个数据,因为26bp read1 (16bp Chromiumbarcodeand 10bp UMI), 98bp read2 (transcript), and 8bp I7 samplebarcode,只有reads2的fastq里面是真正的转录本序列,另外的两个文件都是barcode!
如果是从SRA数据库下载其他人发表文章的数据,早期大部分都是缺胳膊断腿的,见教程:3500个TNBC单细胞转录组数据重处理其实是没办法处理对
然后利用官网软件做比对和定量
官网软件我也写过教程:专门分析10x genomic公司的单细胞转录组数据的软件套件需要下载的软件很简单,就是下载的数据库有点大:
软件及数据库都准备好了,就可以直接用 Cell Ranger 来做分析,代码如下:
就这么简单的代码就可以完成10x单细胞转录组数据的比对和定量。其中比较重要的就是 文件夹下面的表达矩阵了,可以直接被R包Seurat读入进行一系列的处理
R包Seurat进行表达矩阵的下游分析
这就是一个完整的10x公司出品的单细胞转录组数据的完整处理流程啦!
是不是很简单啊!
但是,单细胞转录组数据五花八门,仅仅是掌握10x是远不够的,比如平台的。
后续,我们单细胞天地会一一介绍的,敬请期待哈!
(*^__^*) 嘻嘻……
领取专属 10元无门槛券
私享最新 技术干货