前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >GCTA学习8 | 计算多性状遗传力和遗传相关

GCTA学习8 | 计算多性状遗传力和遗传相关

作者头像
邓飞
发布2022-02-09 09:45:35
1.2K0
发布2022-02-09 09:45:35
举报

大家好,我是飞哥,这一段时间,一直学习GCTA这个软件,学习的过程中就进行了记录和分享。奈何这款软件还是太小众,阅读量不断的降低,不过写的过程是总结的过程,对我自己学习掌握很有帮助。

有朋友告诉我说,我的公众号越来越没有意思了,忘记了初心!所谓的初心就是写段子!

段子好久没写了,老是分享知识太沉重了。所以,我决定,不能像一个工具人一样,虽然要有工具人的技能,但是更要有哲学家的思想,有文学家的情感,有历史学家的深思,有娱乐人的八卦。公众号就要展示精彩,指导生活过得更精彩。

旧的结束,也是新的开始。让我们先结束此篇吧!

前面的几节中,我们介绍了GCTA计算G矩阵,和单性状遗传力的计算,它本质上就是GBLUP的估计,但是速度快很多。本节我们介绍,两性状遗传力和遗传相关的计算。

1. GCTA计算两性状遗传相关常用参数

1.1 --reml-bivar(必须)

这部分,是使用reml的方法进行估计方差组分。默认的是AI算法,可以使用EM算法。

1.2 --reml-alg 指定迭代方法(非必须)

--reml-alg 0 # AI算法,默认算法 --reml-alg 1 # EM算法

1.3 --grm(必须)

指定GRM矩阵

--grm # 接二进制文件GRM的前缀 --grm-bin # 同上 --grm-gz # 接文本的GRM文件前缀

推荐使用二进制的文件,因为速度快,暂用空间少。

1.4 --covar(非必须)

这是接因子协变量的,第一列和第二列分别是FID和IID,后面接因子协变量,比如场年季

1.5 --qcovar(非必须)

接的是数字协变量,比如PCA,比如初生重等

1.6 --pheno(必须)

接的是表型数据,格式也是plink的格式,第一列FID,第二列IID,第三列是表型数据(缺失用NA表示),第四列是表型数据

2. 数据准备

2.1 表型数据

三列,第一列是FID,第二列IID,第三列是表型数据y,没有行头,空格隔开。

2.2 基因型数据

plink的二进制文件

2.3 协变量

这里,示例数据中,没有提供协变量信息。如果提供,可以按照第一列是FID,第二列是IID,其它是协变量的方法整理数据。协变量分为数字协变量和因子协变量,要分开整理。

3. 构建GRM矩阵

「使用Van的方法」

这里,用Van的方法,类似我们GBLUP估计所用的矩阵构建形式。

代码语言:javascript
复制
gcta64 --bfile ../test --make-grm --make-grm-alg 1 --out g2

结果文件:

4. 两性状估算遗传力和标准误

这里,已经构建好了GRM矩阵,指定表型数据,进行遗传力的估计

代码语言:javascript
复制
gcta64 --reml-bivar 1 2 --pheno ../nn_pheno.txt --grm ../grm/g1 --threads 30 --out re1

结果可以看出:

  • Vg11:加性方差组分为:0.51
  • Vg22:加性方差组分为:0.31
  • Vg12:加性协方差为:-0.089
  • Ve11:残差方差组分为:0.56
  • Ve22:残差方差组分为:1.58
  • Ve12:残差协方差组分为:-0.012
  • Vp11:表型方差组分(Vg+Ve),为1.076
  • Vptr2:表型方差组分(Vg+Ve),为1.89

第一个性状,遗传力为0.47,标准误是0.02 第二个性状,遗传力为0.16,标准误为0.03 遗传相关为:-0.22,标准误为0.094

「使用ASReml作为对比」

「方差组分和遗传力结果:」

可以看出,结果完全一样。

5. GCTA多性状不支持的参数

「多性状GCTA不支持的部分:」

❝By default, GCTA will take the first two traits in the phenotype file for analysis. The phenotype file is specified by the option --pheno as described in univariate REML analysis. All the options for univariate REML analysis are still valid here except --mpheno, --gxe, --prevalence, --reml-lrt, --reml-no-lrt and --blup-snp. All the input files are in the same format as in univariate REML analysis. ❞

  • --mpheno
  • --gxe
  • --reml-lrt
  • --reml-no-lrt
  • --blup-snp

6. GCTA的优势和不足

GCTA只能分析两性状的GBLUP遗传评估,计算遗传力和遗传相关,速度很快。

「相对于ASReml软件,缺点如下:」

  • 不支持固定因子缺失
  • 只能是两个性状,3个,以及3个以上不支持
  • 不支持多个随机因子
  • 只能计算遗传相关,不能计算表型相关及标准误

相关系列阅读:

第一篇:GCTA学习1 | 抛砖引玉--初步介绍

第二篇:GCTA学习2 | 软件下载安装--windows和Linux

第三篇:GCTA学习3 | 两篇NG:fast-LMM和fast-GLMM

第四篇:GCTA学习4 | GCTA说明文档--功能分类及常见问题

第五篇:GCTA学习5 | 计算PCA及可视化

第六篇:GCTA学习6 | 计算GRM矩阵(G矩阵)

第六篇:GCTA学习7 | 计算单性状遗传力和标准误

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-01-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 育种数据分析之放飞自我 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. GCTA计算两性状遗传相关常用参数
    • 1.1 --reml-bivar(必须)
      • 1.2 --reml-alg 指定迭代方法(非必须)
        • 1.3 --grm(必须)
          • 1.4 --covar(非必须)
            • 1.5 --qcovar(非必须)
              • 1.6 --pheno(必须)
              • 2. 数据准备
                • 2.1 表型数据
                  • 2.2 基因型数据
                    • 2.3 协变量
                    • 3. 构建GRM矩阵
                    • 4. 两性状估算遗传力和标准误
                    • 5. GCTA多性状不支持的参数
                    • 6. GCTA的优势和不足
                    领券
                    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档