前同桌说, 要带粉丝了, 一个换一个, 我就把题目改了一下, 原来的题目是《遗传育种软件三剑客之一:BLUPF90》,但我还是喜欢现在这个题目《BLUPF90的无敌和寂寞》。
BLUPF90号称遗传评估领域的三剑客之一(另外两个分别是ASREML和DMU), 其应该是最先开发了支持基因组数据的模块, 并且里面的基因组数据过滤筛选非常友好。除了上述优势外,BLUPF90还具有以下功能:
1. ABLUP VS SSGBLUP
传统ABLUP与SSGBLUP的区别在于,原来的A逆矩阵变为了H逆矩阵。
根据系谱计算A矩阵,然后使用Henderson方程组计算BLUP(EBV值)。
2. BLUPF90进行SSGBLUP分析
主要作用:
3. 构建H矩阵的参数设置
4. 基因组数据的筛选
5. 亲子鉴定的作用
6. G矩阵结果数据挖掘
6.1 检测异常个体
G矩阵中, 某些个体对角线有较高的值。这说明有可能这个个体不是群体内的个体, 可能来源于其它群体或者家系, 或者call rate值较低。
如果某两个个体的亲缘关系大于0.9, 则表明这两个个体可能是重复样本。
G矩阵和A22矩阵是相同个体构建的G矩阵和A矩阵,因此二者应该具有很高的相似性。如果对角线和非对角线相似度较低, 这说明出现了一些问题,需要引起重视。可能是测序个体ID错误, 也可能是数据量较少导致等等。
7. 构建A22矩阵时的高效方法
可以看出, 构建A22矩阵时, 使用57,000系谱数据, 6,500测序个体, Tabular用了311s, 内存占用12G, 而Colleau method用了45s, 内存占用322Mb。因此使用Colleau方法更合适。
8. BLUPF90构建H逆矩阵输出
如果想要使用DMU, ASREML或者WOMBAT利用BLUPF90构建好的H逆矩阵,需要输出Original ID的形式。然后转化为DMU和ASREML的格式即可。