首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >在R中查找不带循环的值

在R中查找不带循环的值
EN

Stack Overflow用户
提问于 2015-10-07 11:46:40
回答 2查看 96关注 0票数 2

我需要根据另一个数据帧中的多个标准在数据帧中查找一个值。示例

代码语言:javascript
复制
A=
Country Year Number
USA     1994 455
Canada  1997 342
Canada  1998 987

必须添加了一个名为"rate“的列。

代码语言:javascript
复制
B=
Year   USA   Canada
1993   21    654
1994   41    321
1995   56    789
1996   85    123
1997   65    456
1998   1     999

所以最终的数据框架是

代码语言:javascript
复制
C=
Country Year Number  Rate
USA     1994 455     41
Canada  1997 342     456
Canada  1998 987     999

换句话说:从A到B查找年份和国家,结果是C。我想这样做没有循环。我希望有一个一般的方法,这样我就可以根据两个以上的标准进行查询。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2015-10-07 12:18:54

下面是另一种使用data.table的方法,它不需要将第二个数据表转换为长表单:

代码语言:javascript
复制
require(data.table) # 1.9.6+
A[B, Rate := get(Country), by=.EACHI, on="Year"]
#    Country Year Number Rate
# 1:     USA 1994    455   41
# 2:  Canada 1997    342  456
# 3:  Canada 1998    987  999

其中AB是data.tables,而Country是字符类型的。

票数 7
EN

Stack Overflow用户

发布于 2015-10-07 11:51:41

我们可以melt第二个数据集从‘宽’到‘长’格式,merge与第一个数据集,以获得预期的输出。

代码语言:javascript
复制
library(reshape2)
res <- merge(A, melt(B, id.var='Year'), 
        by.x=c('Country', 'Year'), by.y=c('variable', 'Year'))
names(res)[4] <- 'Rate'
res
#   Country Year Number Rate
#1  Canada 1997    342   456
#2  Canada 1998    987   999
#3     USA 1994    455    41

或者我们可以使用来自tidyrright_jointidyrright_join来完成这个任务。

代码语言:javascript
复制
library(dplyr)
library(tidyr)
gather(B, Country,Rate, -Year) %>%
                       right_join(., A)
#  Year Country Rate Number
#1 1994     USA   41    455
#2 1997  Canada  456    342
#3 1998  Canada  999    987

或者,正如@DavidArenburg在评论中提到的那样,这也可以用data.table来完成。我们将“data.frame”转换为“data.table”(setDT(A)),将第二个数据集转换为melt,并加入on 'Year‘和'Country’。

代码语言:javascript
复制
library(data.table)#v1.9.6+
setDT(A)[melt(setDT(B), 1L, variable = "Country", value = "Rate"), 
                on = c("Country", "Year"), 
                nomatch = 0L]

#    Country Year Number Rate
# 1:     USA 1994    455   41
# 2:  Canada 1997    342  456
# 3:  Canada 1998    987  999

或者更短的版本(如果我们不太挑剔,没有变量名称)

代码语言:javascript
复制
setDT(A)[melt(B, 1L), on = c(Country = "variable", Year = "Year"), nomatch = 0L]
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32991376

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档