提前感谢你在这方面的帮助。我尝试简单地汇总R中的多个数据帧,我有一个正在读取的文件,其输出如下所示:
NDC CHARGE GENERIC
4060 68382006401 43.34 true
4061 68382006401 95.04 true
4062 68382006410 16.77 false我将正在读取的数据文件保存到变量“.csv”中。读取数据后,根据泛型列是true还是false,我将其分为另外两个变量("true“和"false")。我想要做的是有效地总结三个不同数据帧中的一些列。目前我使用的是:
sapply(data[,1:2], summarize)
sapply(true[,1:2], summarize)
sapply(false[,1:2], summarize)总结这些数据。这种方法目前还不错,但我会有更多的变量,而且似乎我应该能够循环它或连接数据帧。
发布于 2013-02-05 04:34:45
你可以把data.frames放在列表中,例如
dat <- data.frame(x=1:5,y=5:1)
datlist <- list(dat,dat,dat)然后,您可以使用lapply在所有data.frames上运行函数
lapply(datlist, function(x) sapply(x[,1:2], summary))将所有结果重新组合到一个data.frame中的一个很好的简单方法是使用plyr包
library(plyr)
ldply(datlist, function(x) sapply(x[,1:2], summary))发布于 2013-02-05 11:39:12
这只是一个猜测,考虑到这个问题中的各种模棱两可的地方,但也许:
sapply(data[,1:2], summarize)
sapply(data[data$GENERIC="true", 1:2], summarize)
sapply(data[data$GENERIC="false", 1:2], summarize)最好将data对象命名为"data“以外的名称。甚至在这个话题上有一大笔财富,使这种命名行为永无止境地令人发笑
install.packages("fortunes")
require("fortunes")
fortune("dog")https://stackoverflow.com/questions/14694928
复制相似问题