aCGH芯片是一种双色芯片,通过红绿两种荧光的比值,通常称之为log2 ratio, 来反应测试样本相对对照样本的DNA拷贝数变化。aCGH芯片的分析,通常包含以下三个步骤
归一化的作用有两个,第一个是校正系统误差,第二个是使得不同样本的log2 ratio可以直接比较。在aCGH芯片种,系统误差包含以下几种
segmentation这一步是将基因组划分为不重叠的区域,每个区域内的拷贝数是一致的, 如下图所示
蓝色的点代表log2 ratio值,红色的线代表划分好之后的区域,每个区域内的log2 ratio校正到一个统一的值,比如均值。划分好的每个区域称之为segment,不同区域之间的点称之为breakpoint。
calling的意思是分析每个segment上的拷贝数变化,根据segment片段对应的log2 ration值,只能够得到结论,测试样本相对对照样本的拷贝数变化,有以下3种情况
分析aCGH芯片的软件很多,不同软件归一化,segmention的算法会有所不同,但是分析的步骤都是上述这几步,为了方便下游分析,有一种存储拷贝数变异的文件格式,称之为SEG, 内容示意如下
是一种\t
分隔的穿文本格式,第一列是样本ID, 第二列到第四列描述的是segment对应的染色体区域,第五列代表该segment区域包含的探针个数,在基于NGS的CNV分析中,这一列表示包含的bin区间的个数,第六列代表该区域内log2 ratio的均值。