前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >为什么一定要处理测序仪出来的10x技术单细胞转录组测序数据呢

为什么一定要处理测序仪出来的10x技术单细胞转录组测序数据呢

作者头像
生信技能树
发布2023-09-20 16:01:31
2060
发布2023-09-20 16:01:31
举报
文章被收录于专栏:生信技能树生信技能树

To serve as inputs for cellranger, FASTQ files should conform to the naming conventions of bcl2fastq and mkfastq:

[Sample Name]S1_L00[Lane Number][Read Type]_001.fastq.gz

Where Read Type is one of:

  • I1: Sample index read (optional)
  • I2: Sample index read (optional)
  • R1: Read 1
  • R2: Read 2

也就是说,其实跑他们自己的 cellranger 流程,我们只需要准备r1和r2文件即可。即使是这样,也有很多人会准备错误,正常准备好了FASTQ文件后走cellranger的定量流程即可,代码我已经是多次分享了。参考:

差不多几个小时就可以完成全部的样品的cellranger的定量流程。但是很多时候,大家是 从公共数据库下载的10x技术单细胞转录组测序数据,而不是自己的测序仪产出的数据,就容易出现

比如:https://kb.10xgenomics.com/hc/en-us/articles/115003802691-How-do-I-prepare-Sequence-Read-Archive-SRA-data-from-NCBI-for-Cell-Ranger- ,需要注意的是使用参数--split-files来替代--split-3 ,就可以生成三个文件

我们推荐的是对自己的准备好了的FASTQ文件跑一下fastqc软件,如下所示的就是命名错误啦 :

命名错误

首先,1-26个cycle就是测序得到了26个碱基,先是16个Barcode碱基,然后是10个UMI碱基;这个文件就是R1了,但是它有可能也是在100bp或者150bp里面,因为测序仪就是这样的规格,只能说浪费掉。。。。

然后,27-34这8个cycle得到了8个碱基,就是i7的sample index;这个文件可有可无,就不关心它了。

最后35-132个cycle得到了98个碱基,就是转录本reads,也有可能是150bp长度的碱基啦,取决于测序仪规格,这个时候测序仪就充分利用了,不浪费。

也就是说大家看得到r1文件其实有可能是很小也有可能是跟r2差不多大小,这样的话就会给大家带来困扰,简单的肉眼看两个准备好了的FASTQ文件的碱基长度是不够的,还需要看质量。如下所示的r2文件被弄错了成为了r1,所以r1文件也会被弄错了成为了r2,如下所示:

所以r1文件也会被弄错了成为了r2

但是,我明明是给小伙伴们解释清楚了,但是仍然是有“好奇宝宝”不满意这个测序仪的浪费,认为明明是r1里面的碱基数量那么少,为什么要在150bp里面呢,希望自己切除它:

希望自己切除它

其实cellranger软件本身是有这个功能的, 完全没有必要自己提前处理r1的fq文件,不过呢,这个也确实是值得探索。参考:https://kb.10xgenomics.com/hc/en-us/articles/13179523030925-Why-do-I-have-an-alert-in-my-web-summary-with-Low-Fraction-of-Valid-UMIs-

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-09-20 08:33,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档