问病例对照匹配最接近的上下级替换-如何多次选择相同的观察结果
EN

Stack Overflow用户

提问于 2017-09-06 21:37:11

回答 1查看 45关注 0票数 0

我想创建一个新的数据集，其中包含排名最接近的“其他”地方当局与“格拉斯哥”地方当局，最接近的更高和最低。它是选择和替换，因此相同的观察可以被多次选择。

DataZone<- c("1005247", "1003253", "1003708", "1003158", "1003428", 
"1004568", "1008765", "1001122", "1005234")
LocalAuthority<-c("Other", "Glasgow","Glasgow","Glasgow","Glasgow", "Other", 
"Glasgow", "Glasgow", "Other")
Rank<-c(1,2,3,4,5,6,7,8,9)
df<-data.frame(DataZone, LocalAuthority, Rank)

在新数据集中我想要的是

DataZone 1005247 -4倍，因为它最接近格拉斯哥的4倍

DataZone 1004568 -6倍，最接近格拉斯哥的4个，最接近2个格拉斯哥的DZ。

DataZone 1005234 -2倍，因为它最接近格拉斯哥的2倍

我的代码为我提供了一个包含所有相关DataZones的新数据集，但它不允许多次选择数据区：

 df<-df[order(df$Rank),]
 IncControls = Loop %>% 
 mutate(newcol = ifelse(!LocalAuthority=="Glasgow"&
 (lag(LocalAuthority)=="Glasgow"|lead(LocalAuthority)=="Glasgow"),1,0) ) %>% 
 filter(newcol==1)

matching

回答 1

Stack Overflow用户

发布于 2017-09-07 00:54:18

您需要指定输出的格式，但您可以尝试这样做

Lengths <- rle(LocalAuthority)$lengths
# 1 4 1 2 1
Positions <- cumsum(rle(LocalAuthority)$lengths)
# 1 5 6 8 9
isGlasgow <- rle(LocalAuthority)$values=="Glasgow"
# FALSE  TRUE FALSE  TRUE FALSE

F <- rep(DataZone[head(Positions[lead(isGlasgow)],-1)], Lengths[isGlasgow])
# "1005247" "1005247" "1005247" "1005247" "1004568" "1004568"
R <- rep(DataZone[tail(Positions[lag(isGlasgow)],-1)], Lengths[isGlasgow])
# "1004568" "1004568" "1004568" "1004568" "1005234" "1005234"

ans <- sort(c(F,R))
ans
# "1004568" "1004568" "1004568" "1004568" "1004568" "1004568" "1005234"
# "1005234" "1005247" "1005247" "1005247" "1005247"

table(ans)
# 1004568 1005234 1005247 
#       6       2       4

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/46076751

复制

相似问题

问病例对照匹配最接近的上下级替换-如何多次选择相同的观察结果
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问病例对照匹配最接近的上下级替换-如何多次选择相同的观察结果EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问病例对照匹配最接近的上下级替换-如何多次选择相同的观察结果
EN