首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

dplyr 1.0.2中的summarise()类似于mutate()

dplyr是一个R语言中用于数据处理和操作的包,它提供了一组简洁且一致的函数,可以高效地对数据进行筛选、排序、分组、汇总等操作。在dplyr 1.0.2版本中,summarise()函数类似于mutate()函数,但有一些区别。

summarise()函数用于对数据进行汇总操作,可以根据指定的变量进行分组,并对每个组进行汇总计算。它可以用于计算每个组的总和、平均值、中位数、最大值、最小值等统计量。与mutate()函数不同的是,summarise()函数返回的结果是每个组的一个单一值,而不是对原数据进行修改。

summarise()函数的应用场景包括但不限于:

  1. 数据汇总统计:可以计算每个组的总和、平均值、中位数等统计量,用于生成摘要报告或进行数据分析。
  2. 数据透视表:可以根据多个变量进行分组,并计算每个组的汇总统计量,用于生成透视表或数据透视图。
  3. 数据预处理:可以对数据进行分组汇总,生成新的变量,用于后续的数据分析或建模。

在腾讯云的产品中,与dplyr类似的数据处理和分析工具是腾讯云数据智能(Data Intelligent,DI)平台。DI平台提供了一系列数据处理、数据分析和机器学习的功能,可以帮助用户高效地进行数据处理和分析工作。具体产品介绍和功能详见腾讯云DI平台官方网站:腾讯云DI平台

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

「R」dplyr 行式计算

「原文来自:dplyr 文档」 上一篇:「R」dplyr 列式计算 通常 dplyr 和 R 更适合对列进行操作,而对行操作则显得更麻烦。...这篇文章,我们将学习围绕rowwise() 创建 row-wise 数据框 dplyr 操作方法。 本文将讨论 3 种常见使用案例: 按行聚合(例如,计算 x, y, z 均值)。...你可以在 rowwise() 中提供“标识符”变量,这些变量将在你调用 summarise() 时候保留,因此它行为类似于将变量传入 group_by(): df <- tibble(name =...按行汇总统计 dplyr::summarise() 让一列多行统计汇总变得非常简单,当它与 rowwise() 结合时,它也可以简便地操作汇总一行多列。...,我们县创建一个行式数据框: rf % rowwise(id) 我们然后使用 mutate() 添加一个新列,或者使用 summarise() 仅返回一个汇总列: rf %>% mutate

6.2K20

「R」dplyr 列式计算

❝在近期使用 「dplyr」 进行多列选择性操作,如 mutate_at() 时,发现文档提示一系列dplyr」 函数变体已经过期,看来后续要退休了,使用 across() 是它们统一替代品,所以最近抽时间针对性学习和翻译下...原文来自 [dplyr 文档](Column-wise operations • dplyr (tidyverse.org "dplyr 文档")) - 2021-01❞ 同时对数据框多列执行相同函数操作经常有用...下面是联合 across() 和它最喜欢动词函数 summarise()一些例子。但你也可以联合 across() 和任意其他dplyr」 动词函数,我们后面会提及。...这使 「dplyr」 更容易使用(因为需要记住函数更少),也使我们更容易实现新动词(因为我们只需要实现一个函数,而不是四个)。...」 开发者们通过 across() 简化了 「dplyr」 对于一些数据复杂操作处理逻辑,提高了整体学习和使用效率,让我们使用者更关注于逻辑而非实现上。

2.4K10

R语言基于dplyr实现数据快捷操作

R语言在处理大数据方面一直是被人诟病地方,那么有人就为R语言打造了一个dplyr包可以实现高效数据预处理,减少内存消耗,提升处理效率。今天就给大家详细看下这个包具体功能。...首先看下包安装: install.packages("dplyr") 接下来我们看下具体功能: 1. as_tibble 将大数据转化为友好展示格式。...5. mutate 为数据集增加新变量。实例: df %>% mutate(z = x + y, z2 = z ^ 2) ? 6. pull 输出单个变量。 7. relocate改变列之间排序。...11. summarise 汇总变量属性,并进行统计输出。...最后我们看下更高级应用实例: ###自定义函数在通道中应用 var_summary <- function(data, var) { data %>% summarise(n = n(),

1.5K40

tidyverse:R语言中相当于python中pandas+matplotlib存在

tidyverse就是Hadley Wickham将自己所写包整理成了一整套数据处理方法,包括ggplot2、dplyr、tidyr、readr、purrr、tibble、stringr、forcats...:数据整理 dplyr下述五个函数用法 4.1 筛选: filter 4.2 排列: arrange 4.3 选择: select 4.4 变形: mutate 4.5 汇总: summarise...4.6 分组: group_by # install.packages("dplyr") library(dplyr) 4.1 筛选: filter() #按给定逻辑判断筛选出符合要求子数据集...,然后Temp列重新计算为(Temp - 32) / 1.8 mutate(airquality, new = -Ozone, Temp = (Temp - 32) / 1.8) 4.5 汇总: summarise...group_by()添加了分组信息后,mutate(),arrange() 和 summarise() 函数会自动对这些 tbl 类数据执行分组操作。

3.9K10

DAY6-学习R包

") 加载 library和require 使用一个R包需先安装再加载 library(dplyrdplyr五个基础函数mutate(),新增列——mutate(test, new = Sepal.Length...))#用desc从大到小summarise():汇总summarise(test, mean(Sepal.Length), sd(Sepal.Length))mean()计算平均值sd()计算标准差group_by...(test, Species)#按照Species分组并汇总summarise(group_by(test,Species),mean(Sepal.Length),sd(Sepal.Length))#按照...Species分组,计算每组Sepal.Length平均值和标准差并汇总dplyr两个实用技能管道操作 %>% —— 相当于将左边作为右边函数第一个参数,快捷键: ctrl+shift+M(不管用...——改为Ctrl+a) test %>%  group_by(Species) %>%  summarise(mean(Sepal.Length), sd(Sepal.Length))count统计某列

18530
领券