例如,在目前的7列中,一列标有“区域”,另一列标记为平均值。我想从区域列中找出某一区域的所有平均值,并找出它们的平均值。这里有太多的数据,但是如果你有凯恩斯,布里斯班(东)和布里斯班(西),我想找出凯恩斯所有行的平均值,并找出平均值,我该怎么做呢?
到目前为止,我已经将数据更改为tibble格式:
QLD.Pokies <- as_tibble(QLD.Pokies)
然后grepl对特定区域进行过滤:
QLD.Pokies %>%
filter(grepl('CAIRNS', Region))
编辑
dataAndWinPEGM <- as_tibble(dataAndWinPEGM)
meanEGM <- dataAndWinPEGM %>%
filter(grepl('CAIRNS', Region)) %>%
select(Win.Per.EGM)
meanEGM
mean(meanEGM[["Win.Per.EGM"]])
使用上面的代码计算平均值,但不确定它是否正确工作。我不能手动计算平均值,因为有190+数字,有什么方法可以检查吗?
发布于 2021-06-02 13:52:00
如果没有您的数据样本,我可以尝试显示iris
数据集的一个工作示例。此外,您还必须加载tidyverse
包。
library(tidyverse)
head(iris)
iris %>%
select(Species, Sepal.Length) %>%
group_by(Species) %>%
summarise(sepal_length_mean = mean(Sepal.Length))
例如,在基本集合中,我们选择几个列,然后对每个物种执行间隔长度的组操作。然后我们取每组的平均数。
# A tibble: 3 x 2
Species sepal_length_mean
* <fct> <dbl>
1 setosa 5.01
2 versicolor 5.94
3 virginica 6.59
希望您可以将其应用于您的数据集。
https://stackoverflow.com/questions/67789115
复制相似问题