前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >GCTA学习4 | GCTA说明文档--功能分类及常见问题

GCTA学习4 | GCTA说明文档--功能分类及常见问题

作者头像
邓飞
发布于 2022-02-09 01:42:07
发布于 2022-02-09 01:42:07
1.7K0
举报

1. GCTA 说明文档

最新版是2021-06-01更新,共有98页:

GCTA说明文档:https://yanglab.westlake.edu.cn/software/gcta/static/gcta_doc_latest.pdf

2. GCTA功能分类

2.1 遗传力、遗传相关、表型预测

  • GRM:构建亲缘关系矩阵
  • Inbreeding:计算近交系数
  • Heritability:估算方差组分和遗传力
  • Partitioning:将方差组分根据染色体、片段、功能区域进行划分
  • X chromosome genetic variance: X染色体的方差组分
  • GREMLd:估计显性效应
  • Bivariate GREML: 双性状遗传评估
  • Haseman-Elston regression: 基于SNP的遗传相关
  • sBLUP:基于BLUP的基因型风险预测

2.2 GWAS分析

  • fastGWA:稀疏矩阵的LMM模型,fast-GWA模块
  • fastGWA-GLMM: GLMM模型的GWAS分析模块
  • MLMA和MLMA-LOCO:稠密矩阵的LMM模型
  • COJO:条件和联合分析
  • mtCOJO:多性状条件和联合分析
  • fastBAT:
  • fastGWA-BB:
  • ACTA-V:

2.3 GWAS数据模拟,群体遗传和孟德尔随机化

  • 模拟GWAS数据
  • GSMR:孟德尔随机化
  • PCA和Fst计算
  • 计算近交系数
  • 计算LD

3. 常见问题

1,样本量少的话遗传力异常

遗传力会是0或者1,标准误很大,不正常,不能分析小样本来的数据。

Q1:GCTA-REML需要多少的样本?如果要想达到比较小的标准误(0.1),至少要3160个不相关的样本。

Q2:为何遗传力的标准误很重要?95%的置信区间是遗传力 +- 1.96*标准误,如果标准误比较大,那么95%的置信区间就比较大(比如0~1),这样意义不大了。

2,估计亲缘关系矩阵计算所需要的内存

这里,介绍了不同的样本数,不同的SNP个数,计算所需要的内存。

下面介绍,估算方差组分估计需要的内存。

3. 方差组分估计中LRT的计算

下面介绍,LRT检验的实施方法。

4. 内存报错

如果内存报错,建议用64位的GCTA。因为32位最多支持4G内存,可能不够。

5. 分析非人类的数据

如果分析的是动物数据,需要设置染色体条数。

6. 为什么我的遗传力是0.9999?

对于case-contral数据,可以设置--reml-no-constrain,这样有可能遗传力大于1.

对于连续性状数据,样本量少的话,标准误比较大,有可能遗传力估计偏高。

7. GCTA可以分析系谱的数据

GCTA可以按照下面操作,分析系谱或家系的数据。

9. 将显著的SNP提取计算方差组分

结果可能会偏高。

10. 可以根据亲缘关系矩阵推断亲子或者全同胞半同胞吗?

可以,但是不准确。

0.5可以看做是一级的:亲子或者全同胞 0.25可以看做是二级的:半同胞或者爷孙 0.125可以看做是三级的:表兄,表妹

「GCTA生成的GRM二进制文件读入到R中」两种方法:1,通过R语言读取二进制文件 2,通过--make-grm-gz,将二进制文件转化为文本文件

11. GCTA可以计算GBLUP的预测值

在这里插入图片描述

12. GCTA分析多性状模型

13. GCTA-GREML如何估算固定效应BLUE值

  • --covar:是因子协变量
  • --qcovar:是数值协变量

14. 为何我用GCTA计算的遗传力为负

因为有标准误,数据量小时,标准误大。

可能本身遗传力就很低,考虑到标准误,会有可能负值。

15. 方差组分估算显示not positive definite

方差组分中V不正定,可以尝试其它迭代方法---reml-lag 1由AI迭代变为Fisher scoring,试一下。

相关系列阅读:

第一篇:GCTA学习1 | 抛砖引玉--初步介绍

第二篇:GCTA学习2 | 软件下载安装--windows和Linux

第二篇:GCTA学习3 | GCTA的两篇NG:fast-LMM和fast-GLMM

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-01-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 育种数据分析之放飞自我 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
ASReml文献解析|如何分析猪繁殖性状遗传参数估计
asreml软件功能非常强大,使用简单,遗传评估和基因组选择的利器,5月份有个遗传评估和基因组选择的培训班(见文末),
邓飞
2024/05/11
2870
ASReml文献解析|如何分析猪繁殖性状遗传参数估计
GCTA学习8 | 计算多性状遗传力和遗传相关
大家好,我是飞哥,这一段时间,一直学习GCTA这个软件,学习的过程中就进行了记录和分享。奈何这款软件还是太小众,阅读量不断的降低,不过写的过程是总结的过程,对我自己学习掌握很有帮助。
邓飞
2022/02/09
1.5K0
GCTA学习8 | 计算多性状遗传力和遗传相关
GCTA如何计算GWAS中SNP的遗传力
里面的遗传力分为:family遗传力,SNP遗传力和GWAS遗传力,他们的关系如下:
邓飞
2022/12/12
1.4K0
GCTA如何计算GWAS中SNP的遗传力
GCTA学习1 | 抛砖引玉--初步介绍
康德说:世界上只有两样东西是值得我们深深景仰的,一个是我们头上的灿烂星空,另一个是我们内心的崇高道德法则。
邓飞
2022/02/08
1.2K0
GCTA学习1 | 抛砖引玉--初步介绍
使用GCTA的GREML评估SNP遗传力
评估SNP遗传力有两种方法LDSC和GREML, 本文介绍下GREML评估遗传力的方法。在GCTA软件中,其核心就是如下所示的线性混合模型
生信修炼手册
2019/12/19
2.9K0
使用GCTA的GREML评估SNP遗传力
一文搞定GCTA软件的学习
前面的几节中,我们介绍了GCTA计算G矩阵,和单性状遗传力的计算,它本质上就是GBLUP的估计,但是速度快很多。本节我们介绍,两性状遗传力和遗传相关的计算。
邓飞
2022/12/13
1.1K0
一文搞定GCTA软件的学习
GCTA学习7 | 计算单性状遗传力和标准误
前面的几节中,我们介绍了GCTA计算G矩阵,本节我们介绍,如果使用GCTA进行遗传力的估计。
邓飞
2022/02/09
3K0
GCTA学习7 | 计算单性状遗传力和标准误
衡量样本亲缘关系,除了IBD你还知道哪些方法?
是一款针对复杂性状的SNP分型数据进行分析的软件,开发的初衷是用于评估表型变异中遗传变异所占的比例,即评估遗传力的大小, 后来逐渐扩展到更多的功能,官网如下
生信修炼手册
2019/12/19
2.3K0
衡量样本亲缘关系,除了IBD你还知道哪些方法?
学习 | BLUP与全基因组选择
很简单,通过构建混合线性模型,估计个体的育种值(BLUP),然后可以推断出子代的育种值应该是亲本的平均值。选择BLUP大的个体就行了。
邓飞
2020/04/27
1.8K0
如何使用NC II 遗传设计估算配合力和遗传力?
非常令人疑惑,于是我就多看了一些教材,发现是有一个万能公式的,即是考虑近交系数,整体结论:
邓飞
2020/08/24
1.5K0
如何使用NC II 遗传设计估算配合力和遗传力?
GCTA学习6 | GCTA计算GRM矩阵(G矩阵)
GRM矩阵,全称:genetic relationship matrix (GRM)。
邓飞
2022/02/09
1.9K2
GCTA学习6 | GCTA计算GRM矩阵(G矩阵)
GWAS分析中SNP解释百分比PVE | 第四篇,MLM模型中如何手动计算PVE?
GWAS分析中SNP解释百分比PVE | 第四篇,MLM模型中如何手动计算PVE? #2021.12.25
邓飞
2021/12/27
2.7K0
GWAS分析中SNP解释百分比PVE | 第四篇,MLM模型中如何手动计算PVE?
消失的遗传力的进一步剖分及应用
下面是Nature上发表文章中的一张图:https://www.nature.com/news/2008/081105/pdf/456018a.pdf
邓飞
2022/12/13
4250
消失的遗传力的进一步剖分及应用
GLMM:广义线性混合模型(遗传参数评估)
这篇文章,主要是介绍了抗性数据,如何利用GLMM模型进行的分析,文中,他将9级分类性状变为了二分类性状,进行分析。
邓飞
2020/09/30
2.1K0
GLMM:广义线性混合模型(遗传参数评估)
BLUP育种值如何计算准确性
「育种值的准确性是什么呢?为何要计算育种值的准确性呢?」育种值的准确性的大小可以反应育种值计算的准确性如何,如果准确性高,就说明计算育种值时依赖的信息多(比如亲子关系、同胞关系等),结果就可靠。
邓飞
2022/02/09
1.2K0
BLUP育种值如何计算准确性
统计遗传学:第九章,GWAS+群体分析+亲缘关系分析
本篇,使用数据和代码演示的形式,展示了GWAS分析、群体结构分析、亲缘关系分析三部分内容。我又重演了一遍,修正了一些bug。文中代码和数据我回头专门整理相关博文进行分享。
邓飞
2022/12/12
3.9K0
统计遗传学:第九章,GWAS+群体分析+亲缘关系分析
孟德尔误差是个什么鬼?
孟德尔定律很数学化,当基因区分显隐性时,分离定律(AaAa呈现3:1),自由组合定律(AaBbAaBb呈现9:3:3:1)。同父同母生育的孩子,应该是遗传父母各一半的遗传物质,因此全同胞的个体应该是一样的。之所以九子各不同,是因为存在抽样误差,而这种误差在遗传学中,又称为孟德尔抽样误差。
邓飞
2019/09/25
1.3K0
孟德尔误差是个什么鬼?
计算配合力(附代码和数据)以及常见问题解答
可以认为,玉米侧交试验,是一个NCII的试验,在玉米实际的育种中,由于其测用结合的特性,应用广泛。
邓飞
2023/11/23
1.1K0
计算配合力(附代码和数据)以及常见问题解答
DMU遗传评估从入门到出家系列
DMU是一个数量遗传学工具包,主要功能包括估计方差组分和固定效应,预测育种值。DMU的开发历史可以追溯到25年前,大部分功能基于数量遗传学研究的需求而开发。在丹麦动物育种研究中,DMU是一个主要的统计研究工具(估计和预测)。此外,DMU也应用于丹麦牛,羊,貂和马等常规遗传评估研究。因此,DMU不但在一些特定的项目中具备高性能优势,也适用于常规数量遗传学研究。“DMU”名称最初来自于程序包中用来进行初始化的过程名字缩写。这些过程利用约束最大似然法(REML),通过Derivative-free方式执行MUltivariate analysis,因此得名DMU。但是,在当前的DMU版本中,并不包括DF-REML模块,现在D仅代表DJF(丹麦农业科学学院的缩写)。
邓飞
2020/05/17
4.1K1
我的农学转数据分析之花花草草
数据分析界育种知识最好、育种界编程最扎实、段子讲得最好的数据分析师,所以:编程+数据分析+育种,就是我的日常工作了。
邓飞
2022/12/12
5320
我的农学转数据分析之花花草草
相关推荐
ASReml文献解析|如何分析猪繁殖性状遗传参数估计
更多 >
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文