我迷失了R中的以下对象:
# create a list of filenames
files <- list.files("directory", full.names = TRUE)
# read all files as csv
data <- lapply(files, function(x) (data.frame(read.csv(x))))
这很好,但我不知道数据的类型,也不知道如何掌握它。让我们看看:
data[1]
[[1]]
Date value1 value2 ID
1 2003-01-01 NA NA
我知道我们可以使用apply或lapply来执行在R中for循环可以做的事情,如果您有一个dataframe,您可以使用apply (dataframe,2,mean)来计算列的平均值,但是,如果我们有数据列表,那么我需要通过删除第一列并将数据转换为数字来进行以下调整。让我们说,数据的列表是列表,其中LIST[1]是第一个数据。
如何使用列表立即执行上述操作。如何使用lapply对列表中的数据进行操作?
lapply(LIST, function (x) some function)
将该操作应用于“不对数据文件进行列表”。以下是没有任何意义的:
lapply(LIST[], function
我试图将数据帧列表中的NA字符串替换为-99.99,以便在RCLIMDEX中运行我的数据。
这是我的一个数据帧的结构,它们都有相同数量的列和行头。
year month day Pr Tx2m Tn2m
1 1987 12 31 NA NA NA
2 1988 1 1 0 NA NA
3 1988 1 2 0 NA NA
4 1988 1 3 0 NA NA
5 1988 1 4 0 NA NA
6 1988 1 5 0 NA NA
我曾尝试使用以下方法:
e
我有一个数据帧列表:
d1<-data.frame(a=rnorm(5), b=rep(2006, times=5), cc=c(1:5))
d2<-data.frame(a=rnorm(5), b=rep(2007, times=5), cc=c(1:5))
d3<-data.frame(a=rnorm(5), b=c(2005:2009), cc=c(1:5)) #data frame with only one 2007 value
d4<-data.frame(a=rnorm(5), b=rep(2007, times=5), cc=c(1:5))
my
我有一个熊猫数据框架,看起来像这样:
# Name City
1 John NYC
2 Doe Berlin
3 Jonathan Tokyo
4 Andrew Barcelona
5 Heather London
.. ...... ......
.. ...... ......
.. ...... ......
60000 Summer Madrid
假设我有一个这样的城市列表:
我是R的新手,所以我在问一个基本的问题。
我有两个数据帧
数据帧1包含匹配对:
Factor1 Factor2
A D
B E
C F
数据帧2包含不同样本中不同因素的水平:
Sample1 Sample2
A 10 0
B 10 0
C 0 0
D 0 10
E 0 10
F 0 0
我正在尝试遍历第一个数据帧。对于数据帧1中的每一行,如果样本1中factor1的电平大于5,并且样本2中因子2的电平大于5,则在数据帧1中添加第三列中的TRUE,否则添