我有一个CSV文件,其中包含许多具有相同列的数据帧,例如:
x y z
1 2 3
3 2 1
x y z
1 3 2
2 3 1
2 1 3
我想做的是,将这些数据加载到数据帧列表中。例如,如下所示:
$`1`
x y z
1 2 3
3 2 1
$`2`
x y z
1 3 2
2 3 1
2 1 3
在R中有什么快速的方法可以做到这一点吗?
我有一个大约400个数据帧的列表,我想为每个数据帧提取特征。所有数据帧的功能都将是相同的。
数据帧由来自加速度计的信号组成,我将应用分类来识别不同的活动。因为我的类是基于特定模式的,所以我需要我的特征(统计特征和频域特征)基于窗口。
我可以直接对数据帧列表执行此操作吗?提取特征,然后将新的特征列添加回每个数据帧的列表中?
任何建议都将不胜感激。我被卡住了。我知道如何在每个数据帧上执行此操作,但处理如此多的数据帧非常耗时。
列表示例
# Dataframes, x and y are accelerometer measurements and a is annotation
df1 <
我是R的新手,我尝试使用一个函数来测试包含600多个变量的大型数据帧中的异常值,除了最后两列之外,所有变量都是数字。我尝试了outliers包中的离群值函数,一次测试一列,最后得到了一个我无法使用的数值向量。有没有更好的方法来识别数据帧中的所有异常值。
myout <- c()
for (i in 1:dim(training)[2]){
if (is.numeric(training[,i])) {
myout <- c(myout,outlier(training[,i])) }
}
我有一个数据帧,如下所示:
loc status ID
0 LA NaN NaN
1 CHC NaN NaN
2 NYC ARR 32
3 CHC DEP 45
4 SEA NaN NaN
我正在尝试根据status列来填充ID列中缺少的值。如果status列是"ARR":我想向后填充,如果status列是"DEP":我想向前填充,这样我的最终数据帧将如下所示:
loc status ID
0 LA NaN 32
1 CHC NaN 32
2 NYC ARR 32
寻找一个矢量化的基R解决方案,为我自己的启迪。我根据数据帧中另一列中的值为数据帧中的列分配一个值。
我的解决方案创建了可能的代码的命名向量,在原始列中查找代码,根据找到的值对命名列表进行细分,并将结果名称分配给新列。我确信有一种方法可以做到这一点,使用我创建的命名向量,它不需要for循环;它是应用的某个版本吗?
dplyr是伟大和有用的,我并不是在寻找使用它的解决方案。
# reference vector for assigning more readable text to this table
tempAssessmentCodes <- setNames(c(600,301,30
我想在数据帧中添加一个新列,根据数据帧的最后一列中显示的索引显示变量。
我的数据框架是这样的:
v1 v2 v3 v4 v5
1 A K F W 2
2 B O J Q 4
3 C M T A 3
4 D Z R B 2
所以想要得到这个
v1 v2 v3 v4 v5 v6
1 A K F W 2 K
2 B O J Q 4 Q
3 C M T A 3 T
4 D Z R B 2 Z
在最后。
有没有人知道怎么做这件事?