HiC数据标准化工具pipeline

一、HiC-Pro 简介

HiC-Pro,可能是最好用的HiC数据标准化处理工具,源于“HiC data processing”。流程主要分为6个步骤,比对、过滤HiC比对结果、检测有效HiC序列、结果合并、构建HiC关联图谱以及关联图谱标准化

HiC-Pro可以输出各个尺度的HiC标准化互作图谱,从每个窗口5Kb到1Mb,当然窗口越大,所生成的互作关系越少,计算时间就越少,反之则越多。此外HiC-Pro还可以进行HICUP、HiCdat等众多HiC数据处理软件所不能进行的等位基因特异性HiC分析。

二、下载安装

(1)下载地址:

https://github.com/nservant/HiC-Pro (版本2.7.8)

(2)安装:

依赖软件还是比较多,分别如下。

bowtie2、g++、sort、samtools(>1.1)

Python2 (注释是2,3不支持version >=2.7)、4个Python模块(pysam (>=0.8.3), bx-python(>=0.5.0), numpy(>=1.8.2), scipy(>=0.15.1) )

R、以及两个R包(RColorBrewer和ggplot2 (>2.2.1) )

(3)解压安装:

unzip HiC-Pro-master.zip && make configure && make install (安装成功如下所示)

(代码可左右滑动,下同)

三、使用

四、结果查看

-o 输出文件夹中,共有bowtie_resultshic_results两个结果文件夹。

其中bowtie_results文件夹下共有三个文件夹:bwt2、bwt2_global和bwt2_local,分别是序列比对结果、染色体间关联比对结果和染色体内部关联比对结果。其中bwt2文件夹下有一些数据统计结果的输出文件,如mpairstat文件(如下)。

hic_results文件夹下共有data、matrix以及pic三个文件夹。data文件夹下是比对上的有效序列对,文件末尾为_allValidPairs;pic文件夹下是各类结果数据统计;matrix文件夹下分为 iced 和 raw 两个文件夹,分别标准化后的关联矩阵和初始的关联矩阵。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180424G1QL1200?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券