前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >人生第一次尝试Chip-seq analysis

人生第一次尝试Chip-seq analysis

原创
作者头像
旋转木马
发布2023-05-17 22:59:27
8041
发布2023-05-17 22:59:27
举报
文章被收录于专栏:生信小白的专栏

20230517 书

由于课题需要开始学习Chip-seq的分析方法,Chip-seq的原理已经有很多介绍啦,我就不再写了。

下载数据 -- prefech 下载SRA文件

代码语言:javascript
复制
# Linux 中使用Prefetch 进行下载
for i in $(cat SRR.txt);do prefetch $i;done

使用Fastq-dump 进行SRA 文件分割

代码语言:javascript
复制
# fastq-dump 进行文件分割 SRA -> fastq.gz
for i in $(cat SRR.txt);do fastq-dump --gzip --split-3 $i/$i.sra;done

使用bowtie2 进行比对,比对前需要构建index

代码语言:javascript
复制
nohup bowtie2-build hg19.fa hg19 & > nohup01.out
bowtie2 -p 6 -3 5 --local -x /reference/bowtie2_index/hg19 -U sample1.fastq.gz | samtools sort -O bam -o ../aligned/sample1.bam &

使用MACS3 进行样本间比较(后续可视化使用)

代码语言:javascript
复制
###重复一起输入找共有peaks
macs3 callpeak -t sample1.bam sample2.bam -c input1.bam input2.bam -f BAMPE -n sample --outdir ./ -g 2.7e9  -B

###重复分别进行比对
macs3 callpeak -t sample1.bam  -c input1.bam -f BAMPE -n sample1 --outdir ./ -g 2.7e9  -B
macs3 callpeak -t  sample2.bam -c input2.bam -f BAMPE -n sample2 --outdir ./ -g 2.7e9  -B

# -t treatment FILENAME,若多个重复,可以-t  A B C
# -c control FILENAME,若多个重复,可以-c  A B C
# -f 指定输入文件,我这是BAMPE格式,注意必须是sort后的bam.
#    可以是”ELAND”, “BED”, “ELANDMULTI”, “ELANDEXPORT”, “ELANDMULTIPET” (for pair-end tags), 
#    “SAM”, “BAM”, “BOWTIE”, “BAMPE” “BEDPE” 任意一个。如果不提供这项,就是自动检测选择。
# -n 生成的文件前缀名
# --outdir 结果文件存放位置,我这里是当前目录
# -g 参考基因组大小hs: 2.7e9; mm: 1.87e9; ce: 9e7; dm: 1.2e8, 不在其中的话,比如说拟南芥,就需要自己提供了。
# -B 会保存更多的信息在bedGraph文件中,如fragment pileup, control lambda, -log10pvalue and -log10qvalue scores
# -q: q值,也就是最小的PDR阈值, 默认是0.05。q值是根据p值利用BH计算,也就是多重试验矫正后的结果。
# -p: 这个是p值,指定p值后MACS2就不会用q值了。
# -m: 和MFOLD有关,而MFOLD和MACS预构建模型有关,默认是5:50,MACS会先寻找100多个peak区构建模型,一般不用改,因为你很大概率上不会懂。

得到以下结果

MACS3 结果文件
MACS3 结果文件

Rscript model.r 得到Pdf 文件

后续可视化进行中......

Deeptools

代码语言:javascript
复制
# 需要首先构建BAM index
sam-tools index sample.bam
# 比较BAM文件
bamCompare -b1 SRR21743214_sort.bam -b2 SRR21743217_sort.bam -o sample_1.bw
# 单个BAM文件
bamCoverage -b x.bam -of bigwig -o x.bw -p 20 --ignoreDuplicates --binSize 10 --normalizeUsing RPKM
# 后续进行可视化

参考信息

https://www.jianshu.com/p/96688fecd864 全面的chip-seq流程 https://www.jianshu.com/p/2b8e2ea26665 主要的参考流程

https://www.jianshu.com/p/26aaba19a605 Chipseeker

https://www.jianshu.com/p/e2b871e93e54 Deeptools1

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 下载数据 -- prefech 下载SRA文件
  • 使用Fastq-dump 进行SRA 文件分割
  • 使用bowtie2 进行比对,比对前需要构建index
    • 使用MACS3 进行样本间比较(后续可视化使用)
      • Deeptools
      • 参考信息
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档