大家好,我是邓飞。
GWAS分析完成后,进行单倍型图分析的核心目的是验证显著性位点的可靠性并深入理解其遗传背景,具体原因包括以下几点:
1,比较流行的图,Block + GWAS pvalue + LD result
参考代码:
LDBlockShow -InVCF Test.vcf.gz -OutPut re2 -Region chr11:24100000:24200000 -InGWAS gwas.pvalue -OutPng -SeleVar 1
结果:
re2.blocks.gz re2.png re2.site.gz re2.svg re2.TriangleV.gz
ShowLDSVG -InPreFix re2 -OutPut temp -InGWAS gwas.pvalue -Cutline 7 -ShowNum -PointSize 3
命令:
LDBlockShow -InVCF Test.vcf.gz -OutPut re3 -Region chr11:24100000:24200000 -InGWAS gwas.pvalue -OutPng -SeleVar 1 -InGFF In.gff
也可以增加SNP的名称:
$ cat Spe.snp
chr11 24142660
chr11 24142669 SpeA
chr11 24142760 SpeB
命令:
LDBlockShow -InVCF Test.vcf.gz -OutPut re3 -Region chr11:24100000:24200000 -InGWAS gwas.pvalue -OutPng -SeleVar 1 -InGFF In.gff -SpeSNPName Spe.snp
2,比较流行的图,Haploview + 箱线图 + 显著性分析 + 单倍型频率统计
进一步分析呢?比如将单倍型block看一下不同样本的分布,统计一下不同单倍型和表型数据的关系,做一个显著性分析不是更有说服力吗?特别是找到的单倍型应用于育种时,通过单倍型的显著性分析更有说服力:
优势单倍型,优良基因,呼之欲出,一图胜千言,这样更有说服力。
如何操作呢?
1,划分单倍型,给出单倍型的类型有几类
2,统计单倍型的频率,每个单倍型有多少样本
3,对单倍型和表型数据进行显著性检验,如果是两个单倍型就用T检验,如果是3个及以上,就用方差分析
4,对结果可视化就是上面图的结果了,有时候还有小提琴图的样式: