前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >fastq 批量处理

fastq 批量处理

原创
作者头像
派大星在吗
发布2021-12-06 13:50:14
7990
发布2021-12-06 13:50:14
举报
文章被收录于专栏:我的技术专刊

首先进入fastq所在文件夹

代码语言:javascript
复制
#cd /path/to/file

1. 质控

代码语言:javascript
复制
#fastqc -o FASTQC/ -t 8 *.fastq.gz
#multiqc ./

2. 过滤

for i in ls *_combined_R1.fastq.gz; do i=${i/_combined_R1.fastq.gz/};

代码语言:javascript
复制
nohup cutadapt -a AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC -A
AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT -q 30 -m 75 --trim-n --report=minimal -o
${i}_out_R1.fastq.gz -p ${i}_out_R2.fastq.gz ${i}_combined_R1.fastq.gz
${i}_combined_R2.fastq.gz & done

3. 比对

代码语言:javascript
复制
#for i in ls *_out_R1.fastq.gz; do i=${i/_out_R1.fastq.gz/}; nohup hisat2 -p
8 --dta -x /path/to/file/hg19/genome -1 ${i}_out_R1.fastq.gz -2
${i}_out_R2.fastq.gz -S ${i}.sam & done

4. 排序

for i in ls *.sam; do i=${i/.sam/}; nohup samtools sort -@ 8 -o ${i}.bam

代码语言:javascript
复制
${i}.sam & done

5. 计数

代码语言:javascript
复制
#for i in ls *.bam; do i=${i/.bam/}; nohup featureCounts -T 5 -p -t exon -g
gene_id -a /path/to/file/genes.gtf -o ${i}.featureCounts.txt ${i}.bam & done

featureCounts -T 5 -p -t exon -g gene_id -a /path/to/file/genes.gtf -o

代码语言:javascript
复制
all.id.txt *.bam

6.查看后台进程

代码语言:javascript
复制

#jobs / ps

jobs用于查看当前终端后台运行的任务。ps命令用于查看瞬间进程的动态

当然啦,一样的套路也可以用于其他类型测序数据的分析,想要继续学习的同学可以查看往期文章进行回顾并尝试哦~

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
作者已关闭评论
0 条评论
热度
最新
推荐阅读
目录
  • for i in ls *_combined_R1.fastq.gz; do i=${i/_combined_R1.fastq.gz/};
  • for i in ls *.sam; do i=${i/.sam/}; nohup samtools sort -@ 8 -o ${i}.bam
  • featureCounts -T 5 -p -t exon -g gene_id -a /path/to/file/genes.gtf -o
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档