最新版是2021-06-01更新,共有98页:
GCTA说明文档:https://yanglab.westlake.edu.cn/software/gcta/static/gcta_doc_latest.pdf




遗传力会是0或者1,标准误很大,不正常,不能分析小样本来的数据。

Q1:GCTA-REML需要多少的样本?如果要想达到比较小的标准误(0.1),至少要3160个不相关的样本。
Q2:为何遗传力的标准误很重要?95%的置信区间是遗传力 +- 1.96*标准误,如果标准误比较大,那么95%的置信区间就比较大(比如0~1),这样意义不大了。

这里,介绍了不同的样本数,不同的SNP个数,计算所需要的内存。

下面介绍,估算方差组分估计需要的内存。

下面介绍,LRT检验的实施方法。

如果内存报错,建议用64位的GCTA。因为32位最多支持4G内存,可能不够。

如果分析的是动物数据,需要设置染色体条数。

对于case-contral数据,可以设置--reml-no-constrain,这样有可能遗传力大于1.
对于连续性状数据,样本量少的话,标准误比较大,有可能遗传力估计偏高。

GCTA可以按照下面操作,分析系谱或家系的数据。

结果可能会偏高。

可以,但是不准确。
0.5可以看做是一级的:亲子或者全同胞 0.25可以看做是二级的:半同胞或者爷孙 0.125可以看做是三级的:表兄,表妹

「GCTA生成的GRM二进制文件读入到R中」两种方法:1,通过R语言读取二进制文件 2,通过--make-grm-gz,将二进制文件转化为文本文件


在这里插入图片描述



因为有标准误,数据量小时,标准误大。
可能本身遗传力就很低,考虑到标准误,会有可能负值。

方差组分中V不正定,可以尝试其它迭代方法---reml-lag 1由AI迭代变为Fisher scoring,试一下。

相关系列阅读:
第一篇:GCTA学习1 | 抛砖引玉--初步介绍
第二篇:GCTA学习2 | 软件下载安装--windows和Linux
第二篇:GCTA学习3 | GCTA的两篇NG:fast-LMM和fast-GLMM