我使用以下命令将一个大型(24,000个观察值和1900个变量)数据集读取到R中:
expression_data<-read.table("data_expression_median.txt", sep="\t", header=TRUE, fill=TRUE)
当我使用view(expression_data)
查看我的数据时,当我用expression_data[1:3,1:5]
拉出有限数量的行/列时,所有数据都正确地显示出来。此外,当我使用命令expression_data[3, 1:5]
时,它会打印列标题和实际值(这是预期的结果):
Hugo_Symbol Entrez_Gene_Id MB.0362 MB.0346 MB.0386
3 CD049690 NA 5.453928 5.454185 5.501577
但是,当我尝试使用expression_data[3,]
或任何其他命令来设置整行的子集来拉出整行时,我只得到了列标题:
Hugo_Symbol Entrez_Gene_Id MB.0362 MB.0346 MB.0386
MB.0574 MB.0503 MB.0641 MB.0201 MB.0218 MB.0316 MB.0189
MB.0891 MB.0658 MB.0899 MB.0605 MB.0258 MB.0506 MB.0420
MB.0223 MB.0445 MB.0199 MB.0517 MB.0155 MB.0428 MB.0117
为什么会这样呢?我做错了什么?我需要以行为单位进行操作,因此我需要能够访问整个行中的数据。
发布于 2021-11-23 15:46:48
R有打印限制,并且您的数据非常广泛。expression_data[3,]
具有所有值,您可以访问它们,只是缺省情况下不会打印它们。
您可以尝试使用打印选项,特别是max.print
选项,以便在控制台中打印更多数据,但R控制台确实不是查看成千上万列数据的错误工具。
如果您正在对数据框的行进行大量数学运算,则可以考虑转换为matrix
以提高效率。
https://stackoverflow.com/questions/70082620
复制相似问题