文章/答案/技术大牛

发布

Tidyverse 数据处理

共 8 篇文章

盘一盘Tidyverse| 筛行选列之select，玩转列操作

盘一盘Tidyverse| 只要你要只要我有-filter 筛选行

Tidyverse|tidyr数据重塑之gather，spread（长数据宽数据转化）

Tidyverse|数据列的分分合合，一分多，多合一

Tidyverse| XX_join ：多个数据表（文件）之间的各种连接

tidyverse|数据分析常规操作-分组汇总（sumamrise+group_by)

数据处理 | R-tidyr包

数据处理|R-dplyr

清单首页Tidyverse 数据处理文章详情

清单「Tidyverse 数据处理」 03/08

Tidyverse|tidyr数据重塑之gather，spread（长数据宽数据转化）

生信补给站

长型数据和宽型数据在数据分析中非常常见，其中宽型数据更具可读性，长型数据则更适合做分析。

R-tidyr主要有以下几大功能：

gather—宽数据转为长数据；
spread—长数据转为宽数据；
unit—多列合并为一列；
separate—将一列分离为多列

unit和separate可参考Tidyverse|数据列的分分合合，一分多，多合一，本文主要介绍利用tidyr包实现长宽数据的转化。

一载入R包，数据

library(tidyverse)
#library(tidyr)
#使用mtcars内置数据集
data(mtcars)
head(mtcars)

二宽数据转为长数据

使用gather函数：gather(data, key, value, … , na.rm = FALSE, convert = FALSE)

其中 data：为待转换的宽数据

key：将原数据框中的所有列赋给一个新变量key

value：将原数据框中的所有值赋给一个新变量value

...：可以指定哪些列聚到一列中（同reshape2区别）

na.rm：是否删除缺失值

1 转换全部列

#宽转长
mtcars_long <- mtcars %>%
  rownames_to_column("car_ID") %>% 
  gather(key = "variables", value = "values")
head(mtcars_long)

2 部分列保持不变

区别于reshape2，...只将指定变量从宽数据变成长数据

1) 不gather car_ID列（行名转化而来）

mtcars_long2 <- mtcars %>%
    rownames_to_column("car_ID") %>%
    gather(key = "variables", value = "values",  - car_ID)
head(mtcars_long2)

2)gather 在 mpg:am之间的所有列

mtcars_long3 <- mtcars %>%
    rownames_to_column("car_ID") %>%
    gather(key = "variables", value = "values",  mpg:am)
head(mtcars_long3)

三长数据转为宽数据

使用spread函数：spread(data, key, value, fill = NA, convert = FALSE, drop = TRUE)

data：待转换的长数据

key：需要将变量值拓展为字段的变量

value：需要分散的值

fill：对于缺失值，可将fill的值赋值给被转型后的缺失值

mtcars_wide <- mtcars_long2 %>% 
    spread(variables, values)
head(mtcars_wide)

这实际将原来gather后的结果还原为gather前, 结果与mtcars一样，只是各列的相互位置稍有调整。

参考资料：

Working_in_the_Tidyverse

Tidyverse 数据处理

Tidyverse|tidyr数据重塑之gather，spread（长数据宽数据转化）

1 转换全部列

2 部分列保持不变

参考资料：

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐