最新版是2021-06-01更新,共有98页:
GCTA说明文档:https://yanglab.westlake.edu.cn/software/gcta/static/gcta_doc_latest.pdf
遗传力会是0或者1,标准误很大,不正常,不能分析小样本来的数据。
Q1:GCTA-REML需要多少的样本?如果要想达到比较小的标准误(0.1),至少要3160个不相关的样本。
Q2:为何遗传力的标准误很重要?95%的置信区间是遗传力 +- 1.96*标准误,如果标准误比较大,那么95%的置信区间就比较大(比如0~1),这样意义不大了。
这里,介绍了不同的样本数,不同的SNP个数,计算所需要的内存。
下面介绍,估算方差组分估计需要的内存。
下面介绍,LRT检验的实施方法。
如果内存报错,建议用64位的GCTA。因为32位最多支持4G内存,可能不够。
如果分析的是动物数据,需要设置染色体条数。
对于case-contral数据,可以设置--reml-no-constrain
,这样有可能遗传力大于1.
对于连续性状数据,样本量少的话,标准误比较大,有可能遗传力估计偏高。
GCTA可以按照下面操作,分析系谱或家系的数据。
结果可能会偏高。
可以,但是不准确。
0.5可以看做是一级的:亲子或者全同胞 0.25可以看做是二级的:半同胞或者爷孙 0.125可以看做是三级的:表兄,表妹
「GCTA生成的GRM二进制文件读入到R中」两种方法:1,通过R语言读取二进制文件 2,通过--make-grm-gz
,将二进制文件转化为文本文件
在这里插入图片描述
因为有标准误,数据量小时,标准误大。
可能本身遗传力就很低,考虑到标准误,会有可能负值。
方差组分中V不正定,可以尝试其它迭代方法---reml-lag 1
由AI迭代变为Fisher scoring,试一下。
相关系列阅读:
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有