sessionInfo()的输出
R version 4.0.5 (2021-03-31)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows >= 8 x64 (build 9200)
Matrix products: default
locale:
[1] LC_COLLATE=English_United States.1252 LC_CTYPE=English_United States.1252 LC_MONETARY=English_United States.1252
[4] LC_NUMERIC=C LC_TIME=English_United States.1252
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] sommer_4.1.4 crayon_1.4.1 lattice_0.20-41 MASS_7.3-53.1 Matrix_1.3-2 data.table_1.14.0
loaded via a namespace (and not attached):
[1] compiler_4.0.5 tools_4.0.5 rstudioapi_0.13 Rcpp_1.0.6 grid_4.0.5
我一直在尝试使用带有以下代码的sommer包执行gwas:
var_cov <- A.mat(m_matrix) ## aditive relationship matrix
model <- GWAS(cbind(DW20, PLA07, PLA08, PLA09, PLA10, PLA11, PLA12, PLA13, PLA14, PLA15, PLA16, PLA17, PLA18, RGR07_09, RGR08_10, RGR09_11, RGR10_12, RGR11_13, RGR12_14, RGR13_15, RGR14_16, RGR15_17, RGR16_18, SA, SL, SW) ~ 1, random = ~ vs(accession, Gu = var_cov), data = pheno2, M = m_matrix, gTerm = "u:accession", n.PC = 5)
正如代码中所描述的,我有26个特征,我想使用K+P模型。我的SNPs矩阵有211,260个标记和309个材料。
当我为一个和两个特征运行这段代码时,它工作得很好。但是,当我尝试运行所有26个特征时,我得到了错误消息:
Error in GWAS(cbind(DW20, PLA07, PLA08, PLA09, PLA10, PLA11, PLA12, PLA13, :
Cube::init(): requested size is too large; suggest to enable ARMA_64BIT_WORD
我在网上搜索了一下,发现这个错误与RcppArmadillo包有关。按照这里(http://arma.sourceforge.net/docs.html#config_hpp_arma_64bit_word)和这里(Large Matrices in RcppArmadillo via the ARMA_64BIT_WORD define)的建议,我尝试通过取消注释文件RcppArmadillo\include\armadillo_bits\config.hpp:中的#define ARMA_64BIT_WORD (下面的)行来启用ARMA_64BIT_WORD
#if !defined(ARMA_64BIT_WORD)
//#define ARMA_64BIT_WORD
//// Uncomment the above line if you require matrices/vectors capable of holding more than 4 billion elements.
//// Note that ARMA_64BIT_WORD is automatically enabled when std::size_t has 64 bits and ARMA_32BIT_WORD is not defined.
#endiff
并在RcppArmadillo\ Makevars.win中的文件中包含以下行。
PKG_CPPFLAGS = -DARMA_64BIT_WORD=1
所有建议都不起作用,我继续收到相同的错误消息。我的问题是:是否还有其他选项来启用我缺少的ARMA_64BIT_WORD?是否有可能在sommer软件包中运行GWAS函数,并具有多达26个特征,或者这个数字太多了?错误消息是由GWAS代码中的错误引起的吗?
非常提前感谢您。
发布于 2021-05-28 20:53:22
我的第一个想法是,当你使用cbind()时,你试图用26个特征来拟合一个非结构化的多变量模型,这意味着如果你有1000条记录,这将是一个309x26= 8,034条记录的模型,这对于sommer使用的直接反演算法来说有点太大了,加上要估计的参数的数量很多(考虑所有协方差参数( 26 *25)/2 = 325 )。我建议在for循环中为每个特征设置一个GWAS,以解决您的问题。除非您有很好的理由运行多变量GWAS,否则这是您的分析的问题,而不是背后的C++代码。例如:
var_cov <- A.mat(m_matrix) ## aditive relationship matrix
traits <- c(DW20, PLA07, PLA08, PLA09, PLA10, PLA11, PLA12, PLA13, PLA14, PLA15, PLA16, PLA17, PLA18, RGR07_09, RGR08_10, RGR09_11, RGR10_12, RGR11_13, RGR12_14, RGR13_15, RGR14_16, RGR15_17, RGR16_18, SA, SL, SW)
for(itrait in traits){
model <- GWAS(as.formula(paste(itrait,"~1")), random = ~ vs(accession, Gu = var_cov), data = pheno2, M = m_matrix, gTerm = "u:accession", n.PC = 5)
}
如果事实证明,即使只有一个特征,arma::cube函数也会出现内存问题,那么我们肯定需要看看为什么armadillo库不能处理这些维度。
干杯,爱德华多
https://stackoverflow.com/questions/67735864
复制相似问题