我有多个CSV文件,其中包含如下结构的数据:
A,B,C,D,
1,2,3,4,
5,6,7,8,
9,10,11,12,
是用蒙特卡罗方法生成的。为了对数据进行统计分析,我需要对每个文件中同一列的所有数据进行统计分析,在一个矩阵中(即在一个矩阵中的多个文件中包含来自列A
的所有数据)。我知道如何用蛮力强迫东西循环,但在R中有比那更简单的方法吗?
样本数据:
A <- c(1,5,9)
B <- c(2,6,10)
C <- c(3,7,11)
D <- c(4,8,12)
data <- data.frame(A,B,C,D)
发布于 2018-04-16 02:47:17
我建议将所有CSV文件中的数据存储在list
中;然后可以使用sapply
提取相关列并将结果列存储在matrix
中。
# Sample data
df <- read.csv(text =
"A,B,C,D,
1,2,3,4,
5,6,7,8,
9,10,11,12,", header = T)
# Store data in a list
lst <- list(df, df);
# Extract column A and store as matrix by `cbind`ing entries
cbind(sapply(lst, function(x) x$A))
# [,1] [,2]
#[1,] 1 1
#[2,] 5 5
#[3,] 9 9
或者对列A
、B
、C
、D
一举做到这一点:
lapply(c("A", "B", "C", "D"), function(s)
cbind.data.frame(sapply(lst, function(x) x[s])))
#[[1]]
# A A
#1 1 1
#2 5 5
#3 9 9
#
#[[2]]
# B B
#1 2 2
#2 6 6
#3 10 10
#
#[[3]]
# C C
#1 3 3
#2 7 7
#3 11 11
#
#[[4]]
# D D
#1 4 4
#2 8 8
#3 12 12
https://stackoverflow.com/questions/49848860
复制相似问题