一般从公司拿到单细胞测序原始数据是这样的:
image.png
因此第一步就需要把这些数据按照I1 R1 R2 用zcat追加起来
for i in `ls rawdata/Day1/*gz|cut -d '/' -f3 | cut -d '_' -f 1,2,3 |sort |uniq`;
do
zcat rawdata/Day1/${i}_I1_001.fastq.gz >> mergedata/Day1/Day1_S1_L001_I1_001.fastq
zcat rawdata/Day1/${i}_R1_001.fastq.gz >> mergedata/Day1/Day1_S1_L001_R1_001.fastq
zcat rawdata/Day1/${i}_R2_001.fastq.gz >> mergedata/Day1/Day1_S1_L001_R2_001.fastq
done
cellranger的数据输入为存储数据的文件夹,如:
image.png
注意文件的名字一定命名为: subject1_S1_L001_R1_001.fastq.gz的格式,否则会报错。
cellranger的用法:https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/using/count 制作注释文件https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/advanced/references#mkref 人的和小鼠的注释文件可以从10X官网下载,我这里用的大鼠的需要自己制作。
cellranger count --id=Day1 \
#fastq文件目录
--fastqs=fastq/ \
#注释文件
--transcriptome=cellranger_rn6 \
--sample=Day1 \
--localcores=10
从cellranger得到表达矩阵就可以导入Seurat分析啦
欢迎关注~