前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Hardy–Weinberg equilibrium

Hardy–Weinberg equilibrium

作者头像
生信修炼手册
发布2020-05-11 10:09:42
1.1K0
发布2020-05-11 10:09:42
举报
文章被收录于专栏:生信修炼手册

Hardy–Weinberg equilibrium,叫做哈迪-温伯格平衡。该定律提出,对于一个足够大的群体,在群体中各个个体之间随机交配,在没有突变,个体迁移,遗传漂变等因素发生的情况下,这个种群的基因频率和基因型频率可以一代代稳定不变,保持平衡。

对于二倍体生物而言,等位基因A的频率用p表示,a的频率用q表示,在满足哈迪-温伯格平衡的群体中,基因型频率如下

AA的频率为 p x p; aa的频率为q x q; Aa的频率为2pq

在实际分析中,会去检验一个SNP位点的基因型频率是否符合哈迪-温伯格平衡。利用样本的SNP分型结果,我们可以观察到种群中基因型的频率,从而推测出allel的频率。

AA基因型频率为P, Aa基因型频率为H,aa基因型频率为Q;则A的频率为 P + H/2;a 的频率为Q + H/2;

利用allel 频率,可以计算出理论上的各个基因型频率,然后利用卡方检验,去比较理论基因型频率和实际观测到的基因型频率之间是否有差异。

对应的卡方统计量计算公式如下

O 代表实际观测到的基因型频率,E代表期望的基因型频率,也就是理论基因型频率。看一个实际的例子

某个种群中,样本数为100,基因型分布如下

Genotype

Count

AA

30

Aa

55

aa

15

假设满足哈迪-温伯格平衡,allel的频率如下

代码语言:javascript
复制
A = 30 / 100 + 55 / 100 / 2 = 0.575
a = 15 / 100 + 55 / 100 / 2 = 0.425

根据allel频率,计算出理论基因型频数

代码语言:javascript
复制
E(AA) = 100 x 0.575 x 0.575 = 33
E(Aa) = 100 x 0.575 x 0.425 x 2 = 49
E(aa) = 100 x 0.425 x 0.425 = 18

计算每种基因型的偏移量

代码语言:javascript
复制
AA : 9 / 33 = 0.27
Aa : 36 / 49 = 0.73
aa : 9 / 18 = 0.5

计算卡方统计量

代码语言:javascript
复制
0.27 + 0.73 + 0.5 = 1.50

在分析卡方检验的结果时,出来统计量的值,还需要关注自由度。在这个例子中,由于是两个allel, 所以自由度为1。

在判断结果是否显著时,通常选择阈值为0.05。在卡方检验表中,自由度为1, P值为0.05时,对应的统计量为3.841。实际算出来的统计量小于3.841,说明理论基因型频率和实际基因型频率没有差异,种群符合哈迪-温伯格平衡。 满足哈迪-温伯格平衡的群体只是理论上的群体,在自然条件下是不存在的。但是在实际处理时,对于较大的群体,可以近似的认为其符合哈迪-温伯格平衡。在分析SNP分型数据时,会利用哈迪-温伯格平衡检验去过滤位点。如果某个SNP位点的基因型频率不符合哈迪-温伯格平衡, 则去除该SNP位点。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-06-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档