首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >计算从另一列过滤的另一列的平均值。

计算从另一列过滤的另一列的平均值。
EN

Stack Overflow用户
提问于 2021-06-01 12:44:39
回答 1查看 63关注 0票数 0

例如,在目前的7列中,一列标有“区域”,另一列标记为平均值。我想从区域列中找出某一区域的所有平均值,并找出它们的平均值。这里有太多的数据,但是如果你有凯恩斯,布里斯班(东)和布里斯班(西),我想找出凯恩斯所有行的平均值,并找出平均值,我该怎么做呢?

到目前为止,我已经将数据更改为tibble格式:

代码语言:javascript
代码运行次数:0
运行
复制
QLD.Pokies <- as_tibble(QLD.Pokies)

然后grepl对特定区域进行过滤:

代码语言:javascript
代码运行次数:0
运行
复制
QLD.Pokies %>%
   filter(grepl('CAIRNS', Region))

编辑

代码语言:javascript
代码运行次数:0
运行
复制
dataAndWinPEGM <- as_tibble(dataAndWinPEGM)
meanEGM <- dataAndWinPEGM %>%
  filter(grepl('CAIRNS', Region)) %>%
  select(Win.Per.EGM)
meanEGM
mean(meanEGM[["Win.Per.EGM"]])

使用上面的代码计算平均值,但不确定它是否正确工作。我不能手动计算平均值,因为有190+数字,有什么方法可以检查吗?

EN

回答 1

Stack Overflow用户

发布于 2021-06-02 13:52:00

如果没有您的数据样本,我可以尝试显示iris数据集的一个工作示例。此外,您还必须加载tidyverse包。

代码语言:javascript
代码运行次数:0
运行
复制
library(tidyverse)
    
head(iris)
    
iris %>% 
   select(Species, Sepal.Length) %>% 
   group_by(Species) %>% 
   summarise(sepal_length_mean = mean(Sepal.Length))

例如,在基本集合中,我们选择几个列,然后对每个物种执行间隔长度的组操作。然后我们取每组的平均数。

代码语言:javascript
代码运行次数:0
运行
复制
# A tibble: 3 x 2
  Species    sepal_length_mean
* <fct>                  <dbl>
1 setosa                  5.01
2 versicolor              5.94
3 virginica               6.59

希望您可以将其应用于您的数据集。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67789115

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档