文章/答案/技术大牛

发布

社区首页 >问答首页 >合并数据集，其中键位于一个数据集的列上，另一个数据集的行位于R中

问合并数据集，其中键位于一个数据集的列上，另一个数据集的行位于R中
EN

Stack Overflow用户

提问于 2016-11-08 19:53:26

回答 3查看 84关注 0票数 1

如何合并数据集，其中键位于一个数据集的列上，另一个数据集的行位于R中？

示例数据：

group = c("a", "b", "c", "c")
id1 = c(1, 0, 0, 0) 
id2 = c(0, 1, 0, 1)
id3 = c(0, 0, 1, 0) 
df1 = data.frame(group,id1, id2, id3) 
df1

id = c("id1", "id2", "id3") 
iv1 = c(2, 3, 3) 
iv2 = c(3, 2, 3) 
df2 = data.frame(id, iv1, iv2) 
df2

我喜欢通过ids合并这两个数据集。如果我能做到的话：

df1$iv1 = ifelse(df1$id1 == 1, 2, 3)
df1$iv2 = ifelse(df1$id2 == 1, 2, 3)

其结果是：

  group id1 id2 id3 iv1 iv2
1     a   1   0   0   2   3
2     b   0   1   0   3   2
3     c   0   0   1   3   3
4     c   0   1   0   3   2

如果说我有1000个变量要合并的话，那么ifelse的方式将是乏味的。是否有更有效的方法来合并像这样的数据集？

merge

回答 3

Stack Overflow用户

回答已采纳

发布于 2016-11-08 20:23:14

我们可以使用这样的事实:第一个列顺序与第二个列顺序匹配。

df1[c("iv1", "iv2")] <- df2[max.col(df1[-1]),-1]
#   group id1 id2 id3 iv1 iv2
# 1     a   1   0   0   2   3
# 2     b   0   1   0   3   2
# 3     c   0   0   1   3   3
# 4     c   0   1   0   3   2

票数 4

Stack Overflow用户

发布于 2016-11-08 20:28:48

皮埃尔·拉福尔已经给出了一个很好的答案。尽管如此，我还是会发布我的解决方案：

ids <- colnames(df1[, 2:4])
ids <- apply(df1[, 2:4], 1, function(x) return(ids[as.logical(x)]))

df1$id <- ids
new_df <- merge(df1, df2, by="id", all.x = TRUE, sort=FALSE)

> new_df
   id group id1 id2 id3 iv1 iv2
1 id1     a   1   0   0   2   3
2 id2     b   0   1   0   3   2
3 id2     c   0   1   0   3   2
4 id3     c   0   0   1   3   3

票数 0

Stack Overflow用户

发布于 2016-11-08 21:14:18

皮埃尔和伊斯雷尔的回答都很好。对于这种更复杂的操作，您还可以使用Hadley Wickham的流行tidyr包：

install.packages('tidyr', repos='http://cran.rstudio.org')
library(tidyr)

g1 <- gather(df1, idx, id_val, -group)  # colnames are in 'idx'; 12 rows total
g1 <- g1[g1$id_val==1, ]                # drop rows with id_val == 0
g2 <- merge(g1, df2, by.x='idx', by.y='id')
g3 <- spread(g2, idx, id_val)           # pivot the 'idx' column back out
g3
#   group iv1 iv2 id1 id2 id3
# 1     a   2   3   1  NA  NA
# 2     b   3   2  NA   1  NA
# 3     c   3   2  NA   1  NA
# 4     c   3   3  NA  NA   1
g3[is.na(g3)] <- 0
g3
#   group iv1 iv2 id1 id2 id3
# 1     a   2   3   1   0   0
# 2     b   3   2   0   1   0
# 3     c   3   2   0   1   0
# 4     c   3   3   0   0   1

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/40495316

复制

相似问题

问合并数据集，其中键位于一个数据集的列上，另一个数据集的行位于R中
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问合并数据集，其中键位于一个数据集的列上，另一个数据集的行位于R中EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问合并数据集，其中键位于一个数据集的列上，另一个数据集的行位于R中
EN