首页
学习
活动
专区
工具
TVP
发布

10x的单细胞转录组数据就应该这样处理

未知的东西总是让人害怕,即使是花时间看他人做过一遍也好过踟蹰不前,请看好:

首先需要10x仪器出来的fastq数据

这个可以看前面的教程:10X genomics单细胞数据集探索列出了非常多的官网教程。

比如,最小的测试数据集,如下:

可以看到左右端测序数据大小不一致,而且每次测序是有3个数据,因为26bp read1 (16bp Chromiumbarcodeand 10bp UMI), 98bp read2 (transcript), and 8bp I7 samplebarcode,只有reads2的fastq里面是真正的转录本序列,另外的两个文件都是barcode!

如果是从SRA数据库下载其他人发表文章的数据,早期大部分都是缺胳膊断腿的,见教程:3500个TNBC单细胞转录组数据重处理其实是没办法处理对

然后利用官网软件做比对和定量

官网软件我也写过教程:专门分析10x genomic公司的单细胞转录组数据的软件套件需要下载的软件很简单,就是下载的数据库有点大:

软件及数据库都准备好了,就可以直接用 Cell Ranger 来做分析,代码如下:

就这么简单的代码就可以完成10x单细胞转录组数据的比对和定量。其中比较重要的就是 文件夹下面的表达矩阵了,可以直接被R包Seurat读入进行一系列的处理

R包Seurat进行表达矩阵的下游分析

这就是一个完整的10x公司出品的单细胞转录组数据的完整处理流程啦!

是不是很简单啊!

但是,单细胞转录组数据五花八门,仅仅是掌握10x是远不够的,比如平台的。

后续,我们单细胞天地会一一介绍的,敬请期待哈!

(*^__^*) 嘻嘻……

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180209G1CDW600?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券