文章/答案/技术大牛

发布

社区首页 >问答首页 >计算除当前组外的所有组的平均值。

问计算除当前组外的所有组的平均值。
EN

Stack Overflow用户

提问于 2021-03-28 01:56:32

回答 5查看 154关注 0票数 4

我有一个包含两个分组变量'mkt‘和'mdl’的数据框架，还有一些值'pr'：

df <- data.frame(mkt = c(1,1,1,1,2,2,2,2,2),
                 mdl = c('a','a','b','b','b','a','b','a','b'),
                 pr = c(120,120,110,110,145,130,145,130, 145))

df

  mkt mdl  pr
1   1   a 120
2   1   a 120
3   1   b 110
4   1   b 110
5   2   b 145
6   2   a 130
7   2   b 145
8   2   a 130
9   2   b 145

在每个“mkt”中，除当前的“mdl”外，每个“mdl”的平均值应计算为所有其他“mdl”中的“pr”的平均值。

例如，对于由mkt == 1和mdl == a定义的组，“avgother”计算为mkt == 1 (相同的'mkt')和mdl == b (除当前组a之外的所有其他'mdl‘)的平均'pt’。

预期结果：

#   mkt mdl  pr avgother
# 1   1   a 120      110
# 2   1   a 120      110
# 3   1   b 110      120
# 4   1   b 110      120
# 5   2   b 145      130
# 6   2   a 130      145
# 7   2   b 145      130
# 8   2   a 130      145
# 9   2   b 145      130

group-by

average

mean

回答 5

Stack Overflow用户

发布于 2021-03-28 02:07:05

首先，获取每个mkt和mdl值的平均值，对于每个mkt，排除当前值，并得到剩余值的平均值。

library(dplyr)
library(purrr)

df %>%
  group_by(mkt, mdl) %>%
  summarise(avgother = mean(pr)) %>%
  mutate(avgother = map_dbl(row_number(), ~mean(avgother[-.x]))) %>%
  ungroup %>%
  inner_join(df, by = c('mkt', 'mdl'))

#    mkt mdl   avgother    pr
#  <dbl> <chr>    <dbl> <dbl>
#1     1 a          110   120
#2     1 a          110   120
#3     1 b          120   110
#4     1 b          120   110
#5     2 a          145   130
#6     2 a          145   130
#7     2 b          130   145
#8     2 b          130   145
#9     2 b          130   145

票数 1

Stack Overflow用户

发布于 2021-03-28 02:48:45

使用data.table，计算和和长度为'mkt‘。然后，在每个mkt-mdl组中，将平均值计算为(mkt sum - group sum) / (mkt length - group length)。

library(data.table)
setDT(df)[ , `:=`(s = sum(pr), n = .N), by = mkt]
df[ , avgother := (s - sum(pr)) / (n - .N), by = .(mkt, mdl)]
df[ , `:=`(s = NULL, n = NULL)]
#    mkt mdl  pr avgother
# 1:   1   a 120      110
# 2:   1   a 120      110
# 3:   1   b 110      120
# 4:   1   b 110      120
# 5:   2   b 145      130
# 6:   2   a 130      145
# 7:   2   b 145      130
# 8:   2   a 130      145
# 9:   2   b 145      130

票数 1

Stack Overflow用户

发布于 2021-03-28 13:07:46

考虑多个ave调用的基R，使用sum / count的均值分解版本进行不同级别的分组计算。

df <- within(df, {
      avgoth <- (ave(pr, mkt, FUN=sum) - ave(pr, mkt, mdl, FUN=sum)) /
                  (ave(pr, mkt, FUN=length) - ave(pr, mkt, mdl, FUN=length))
})

df
#   mkt mdl  pr avgoth
# 1   1   a 120    110
# 2   1   a 120    110
# 3   1   b 110    120
# 4   1   b 110    120
# 5   2   b 145    130
# 6   2   a 130    145
# 7   2   b 145    130
# 8   2   a 130    145
# 9   2   b 145    130

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/66837762

复制

相似问题

问计算除当前组外的所有组的平均值。
EN

回答 5

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问计算除当前组外的所有组的平均值。EN

回答 5

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问计算除当前组外的所有组的平均值。
EN