首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >HiChIP 数据分析: 过滤及Peak Calling

HiChIP 数据分析: 过滤及Peak Calling

作者头像
数据科学工厂
发布2025-09-17 14:49:12
发布2025-09-17 14:49:12
2700
代码可运行
举报
运行总次数:0
代码可运行

比对结果过滤

过滤步骤将配置文件和每个 mate 的最终合并 BAM 文件作为输入,并使用以下命令执行 reads 配对并将其分配到限制片段(-s proc_hic):

代码语言:javascript
代码运行次数:0
运行
复制
$HiC-Pro -c config-HiChIP.txt -i HiC_Pro/bowtie_results/bwt2 -o HiC_Pro -s proc_hic -s quality_checks

其中 -s quality_checks 保存与该第二步相关的统计和诊断图。

该命令在 hic_results/ 文件夹内生成一个 data/ 子文件夹,其中包含所有有效相互作用产物的坐标(.allValidPairs 文件)。

由于 HiC-Pro 执行配置文件中定义的所有过滤,因此可以使用一组修改后的过滤器重新运行过滤步骤。 首先,read pairs 根据其比对和配对情况进行过滤。 接下来,read pairs 被映射到限制片段上,并根据它们在限制片段上的位置和方向被分类为有效和无效 pairs。 然后,PCR 重复被移除,去重后的有效 pairs 被保存在 .allValidPairs 文件中。

如上表所总结的那样,在我们的数据集中,我们平均保留了约 28% 的测序 reads。

ChIP-Seq Peak Calling

为了用 hichipper 从 HiChIP 数据中准确鉴定相互作用区域,在可获得的情况下,提供来自 ChIP-Seq 实验的蛋白结合信息是有用的。

hichipper 将 ChIP-Seq peak 坐标以 BED 格式作为输入;我们将从 hESC 在 HS 处理前后 Rad21 ChIP-Seq 的原始 reads 开始生成此类文件。

在 fastq_ChIP 文件夹中下载 FASTQ 文件后,我们应用一个标准 pipeline,包括比对、转换为 BAM 格式、排序、去重复,最后进行 peak calling。

第一步是使用 bowtie 对 hg19 进行比对:

代码语言:javascript
代码运行次数:0
运行
复制
mkdir bowtie
mkdir ChIP_peaks
export BOWTIE_INDEXES=/home/Annotation/Homo_sapiens/UCSC/hg19/Sequence/BowtieIndex/

bowtie -S -t -p 16 -m 1 genome -1 fastq_ChIP/Rad21_1.fastq -2 fastq_ChIP/Rad21_2.fastq > bowtie/Rad21.sam

bowtie -S -t -p 16 -m 1 genome -1 fastq_ChIP/IgG_1.fastq -2 fastq_ChIP/IgG_2.fastq > bowtie/IgG.sam

接着,我们利用 samtools 进行 SAM 到 BAM 的转换,以及随后的排序和去重复:

代码语言:javascript
代码运行次数:0
运行
复制
samtools view -S -h -b bowtie/Rad21.sam -o bowtie/Rad21.bam

samtools view -S -h -b bowtie/IgG.sam -o bowtie/IgG.bam

samtools sort bowtie/Rad21.bam -o bowtie/Rad21.sort.bam

samtools sort bowtie/IgG.bam -o bowtie/IgG.sort.bam

samtools rmdup bowtie/Rad21.sort.bam bowtie/Rad21.sort.noDup.bam

samtools rmdup bowtie/IgG.sort.bam bowtie/IgG.sort.noDup.bam

rm bowtie/*.sam

rm bowtie/Rad21.bam

rm bowtie/IgG.bam

rm bowtie/*.sort.bam

最后,我们使用 MACS2 来Call ChIP-Seq peaks:

代码语言:javascript
代码运行次数:0
运行
复制
macs2 callpeak -t bowtie/Rad21.sort.noDup.bam -c bowtie/IgG.sort.noDup.bam --keep-dup all -g 2685511504 -n ChIP_peaks/Rad21

该命令将产生多个输出;对于 loop 的鉴定,我们需要 narrowPeak 文件(一种 BED 格式)。

最后,我们过滤 narrowPeak 文件,去除与 ENCODE blacklist 区域重叠的 peaks,通过以下命令生成最终的 Rad21_peaks.noBL.narrowPeak 文件:

代码语言:javascript
代码运行次数:0
运行
复制
intersectBed -a ChIP_peaks/Rad21_peaks.narrowPeak -b hg19_DAC_blacklist.bed -v > ChIP_peaks/Rad21_peaks.noBL.narrowPeak

我们分别在 untreated 和 HS 条件下获得 44,190 和 53,219 个显著的 Rad21 peaks。

未完待续,欢迎关注!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-08-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 冷冻工厂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 比对结果过滤
  • ChIP-Seq Peak Calling
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档