我试图总结我的数据集中的所有列(其中有许多列,尽管下面的rep示例只有2),获取每个变量的平均值和sd。我希望输出是长格式的。
#Example dataset
d <- iris %>% select(Sepal.Length,Sepal.Width)
names(d) <- c("SepalLength","SepalWidth")
#Summarizing and trying to make it long
s <- d %>% summarize_each( list(mean=mean,sd=sd) ) # has
我正在使用pivot_longer将我的数据从宽到长的格式重塑为多个值列。我知道有相关的问题(Pivot_longer 6 columns to 3 columns或Tidy dataset with pivot_longer: Multiple columns into two columns),但到目前为止我还找不到解决方案,可能是因为我的两个列属于不同的类,第一个列是POSIXct,第二个列是numeric。 下面是一个最小的工作示例: structure(list(compid = c("AT9130162999", "AT9090003478"
数据帧have包括几千个遵循命名模式的向量。每个向量名都包含一个名词,然后是_a、_b或_c。以下是前10瓶和10瓶:
id turtle_a banana_a castle_a turtle_b banana_b castle_b turtle_c banana_c castle_c
A -0.58 -0.88 -0.56 -0.53 -0.32 -0.42 -0.52 -0.89 -0.72
B NA NA NA
我正在尝试将一个dataframe的多个特定列融化/堆栈/收集到2列中,保留所有其他列。我尝试过很多很多关于堆叠溢出的答案,但都没有成功(有些在下面)。基本上,我这里有一个类似于这个帖子的情况:只保留和合并更多的列。重要的是要提到我的年份列是因素,而且我有很多,更多的列比下面列出的示例,所以我想调用列名而不是位置。
>df
ID Code Country year.x value.x year.y value.y year.x.x value.x.x
1 A USA 2000 34.33422 2001 35.35
我有一个数据框架如下:
Z1 Z2 Y1 Y2 smpl
0.451 0.333 0.034 0.173 A
0.491 0.270 0.033 0.207 B
列Z1和Z2是来自同一个示例的多个观察结果。Y1和Y2也是如此。
我需要合并列Z1和Z2,以及列Y1和Y2。产生以下结果:
Z Y smpl
0.451 0.034 A
0.333 0.173 A
0.491 0.033 B
0.270 0.207 B
我相信这个解决方案是微不足道的,但
我正在寻找类似于部分pivot_longer的东西。下面的例子很好用,但它并不优雅,当我有更多的专栏_1,_2,_n时,它会变得混乱。
library(tidyr)
library(dplyr)
#>
#> Attache Paket: 'dplyr'
#> The following objects are masked from 'package:stats':
#>
#> filter, lag
#> The following objects are masked from 'package:bas