本文主要对insulation score
的提出与计算方法进行简要的介绍,并展示一个计算insulation score
的过程。
insulation score
是dekker[1]实验室在2015年发表于Nature
上的Condensin-driven remodelling of X chromosome topology during dosage compensation[2]文章中提出的,其主要用于TAD
相关的分析与表征,目前insulation score
主要用于识别TAD
insulation score
计算过程动画
在给定的区域内,沿着互作矩阵的对角线,以一个正方形的滑动窗口,从上至下滑动,计算每个窗口内互作程度值的总和。
这些bin
之间存在这很强的insulation
现象,例如在TAD
的边界,这些区域的insulation score
(根据insulation square测定
)很低。
那些互作程度较高,比如TAD
内部的区域,它们的insulation score
很高。
这些insulation score
很低的区域,可能就是潜在的TAD
边界。
insulation score
标准化标准化公式
ISavg: 是所有
IS
值的平均值
bin
的delta
值insulation score 曲线
将每个bin
的互作强度值作为value
,画出其在染色体上的波动曲线,波谷处就是需要识别的边界。为了识别出黑色曲线中的波谷,方法中又定义了一个window
,对每个bin
内的insulation
值计算delta
值,最终红色曲线中经过X轴的坐标即为insulation score
值曲线的波谷,也就是TAD边界的位置(从上图可以看到,红色曲线穿过0刻度线的点,对应的就是黑色波动曲线的波谷)。
TAD
边界 由于该方法计算的是TAD
的边界位置,因此TAD domain
的位置区域,需要进一步的转换,才能得到。
公式总结
下面介绍如何用FAN-C[4]计算insulation score
pip install fanc -i https://pypi.tuna.tsinghua.edu.cn/simple
conda
进行安装conda create -n fanc python=3.7
conda activate fanc
conda install fanc
利用不同的windows size计算insulation score
fanc insulation ./example.hic ./example.insulation \
-w 1000000 1500000 2000000 2500000 3000000 3500000 4000000 \
-o bed # 输出bed 格式
TAD
强度变化图TAD
边界强度变化图,大体上可以反映TAD之间隔绝情况,绝缘系数越低,TAD
之间交互越弱。
边界强度变化图
fancplot -o ./insulation.png chr18:18mb-28mb \
-p ./example.hic -m 4000000 -vmin 0 -vmax 0.05 \
-p ./example.insulation
fancplot --width 6 -o ./example.png \
chr18:18mb-28mb -p triangular ./example.hic -m 4000000 \
-vmin 0 -vmax 0.05 -p line ./example.insulation_1mb.bed \
./example.insulation_2mb.bed -l "1mb" "2mb"
insulation score 曲线
[1]
dekker: https://github.com/dekkerlab/crane-nature-2015
[2]
Nature: https://www.nature.com/articles/nature14450#citeas
[3]
公式: https://www.jianshu.com/p/fd39eeaf1e75
[4]
FAN-C: https://fan-c.readthedocs.io/en/latest/index.html