概念定义共祖系数:共祖系数为概率fAB,表示一个来自个体A,另一个来自个体B的两个同源基因(或等位基因)在系谱上是一致或相同的概率,也就是说来自同一祖先基因的概率,
相关系数: 是2倍的共祖系数
近交系数: 近交系数(inbreeding coefficient)是指根据近亲交配的世代数,将基因的纯化程度用百分数来表示即为近交系数,也指个体由于近交而造成异质基因减少时,同质基因或纯合子所占的百分比也叫近交系数,个体中两个亲本的共祖系数。
如果系谱构建好的A矩阵,如何进行家系划分呢?
包括行号和列号
# 热点图
heatmap(Amat)
# 横向聚类1
library(amap)
clu <- hclusterpar(Amat)
plot(clu,sub="",hang = -1,xlab = NA,ylab = NA,main = NA)
# 横向聚类
library(cluster)
agnx <- agnes(Amat,method = "complete")
pltree(agnx)
# 纵向聚类
dagn <- as.dendrogram(as.hclust(agnx))
plot(dagn, horiz = TRUE, center = TRUE,
nodePar = list(lab.cex = 0.6, lab.col = "forest green", pch = NA))
关于拓展,你有什么想到的呢?
如果根据系谱,构建A矩阵,然后将相关的个体提取出来,划分家系,这不就是聚类分析灵活的例子么?
如果根据基因组信息,构建G矩阵或者H矩阵,然后将感兴趣的个体提取出来,划分家系,指导育种选配,不也是一个方向么?
然后题目就构成了:如何利用系谱信息进行家系划分并可视化