前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >sra转fastq

sra转fastq

原创
作者头像
用户10455752
发布2024-07-12 11:58:38
900
发布2024-07-12 11:58:38
举报
文章被收录于专栏:单细胞

因为恰好遇到了PRJNA752099这个数据集,他上传的fastq文件被合并成了一个,所以我需要下载SRA文件重新拆分。正好作为上游最后一块的补充内容。

下载sratoolkit

代码语言:linux
复制
wget --output-document sratoolkit.tar.gz https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/current/sratoolkit.current-ubuntu64.tar.gz
tar -vxzf sratoolkit.tar.gz
export PATH=$PATH:$PWD/sratoolkit.3.1.1-ubuntu64/bin
faster-dump --help

我事先下载了PRJNA752099的4个SRA文件,所以这里从转fastq开始。

代码语言:linux
复制
mkdir fastq_store
ls SRR* > list.txt
#sh脚本
samples=$(<list.txt)
for s in ${samples};do
   echo "${s} starts at $(date)"
   fasterq-dump ./${s} -O fastq_store -e 10 --include-technical -S 
   echo "${s} finished at $(date)"
done

这里解释一下faster-dump需要设置--include-technical才能读取barcode之类的reads,而且无法输出.gz格式的压缩文件,需要自行压缩。

运行完成后可以看到每个样本输出了3个fastq文件。

分别查看这几个文件,可以看到1是索引信息,2中是barcode,3是对应R2的长读

接下来只需要压缩后软链接到cellranger脚本路径下改名然后开始定量啦。

代码语言:linux
复制
nohup gzip SRR*_1.fastq SRR*_2.fastq SRR*_3.fastq &

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档