开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

R将更复杂的函数summarize_if到多个列

R语言中的dplyr包提供了一个函数summarize_if，它可以用于对多个列进行汇总计算。

summarize_if函数的语法如下： summarize_if(.data, .predicate, .funs, ...)

参数说明：

.data：要进行汇总计算的数据框或数据表。
.predicate：一个逻辑表达式，用于选择要进行汇总计算的列。可以是一个函数，也可以是一个列名的字符向量。
.funs：一个或多个要应用于所选列的汇总函数。可以是内置的汇总函数，也可以是自定义的函数。
...：其他参数，用于传递给汇总函数。

summarize_if函数的作用是根据指定的条件对选择的列进行汇总计算，并返回一个包含计算结果的新数据框。

使用示例：假设我们有一个名为df的数据框，包含三列：A、B和C。我们想要对列A和列B进行求和计算。

library(dplyr)

df <- data.frame(A = c(1, 2, 3),
                 B = c(4, 5, 6),
                 C = c(7, 8, 9))

result <- df %>%
  summarize_if(.predicate = is.numeric, .funs = sum)

在上面的示例中，我们使用summarize_if函数选择了所有的数值列（.predicate = is.numeric），并应用了sum函数进行求和计算（.funs = sum）。最终，result将包含列A和列B的求和结果。

推荐的腾讯云相关产品和产品介绍链接地址：

腾讯云服务器（CVM）：https://cloud.tencent.com/product/cvm
腾讯云数据库（TencentDB）：https://cloud.tencent.com/product/tencentdb
腾讯云对象存储（COS）：https://cloud.tencent.com/product/cos
腾讯云人工智能（AI）：https://cloud.tencent.com/product/ai
腾讯云物联网（IoT）：https://cloud.tencent.com/product/iot
腾讯云区块链（Blockchain）：https://cloud.tencent.com/product/baas
腾讯云元宇宙（Metaverse）：https://cloud.tencent.com/product/metaverse

请注意，以上链接仅供参考，具体的产品选择应根据实际需求和情况进行评估。

相关搜索:R-对多个列应用相同的函数 R:将每小时的数据透视到列 R中更复杂的三角函数的作图 R写入将列绑定到数据帧的函数 R函数按从多行到列的顺序添加分层列？R在行内的多个条件上使用any() -更复杂的版本 R将多个列聚合到唯一的 R将字典迭代为多个值的函数使用:和-符号将列拆分为R中的多个列具有多个列和数据帧R的函数gsub

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

使用dplyr进行数据转换

dplyr最常用的5个函数： • 按值筛选观测(filter())。 • 对行进行重新排序(arrange())。 • 按名称选取变量(select())。 • 使用现有变量的函数创建新变量(mutate())。 • 将多个值总结为一个摘要统计量(summarize())。函数的使用方法： (1) 第一个参数是一个数据框。 (2) 随后的参数使用变量名称(不带引号)描述了在数据框上进行的操作。 (3) 输出结果是一个新数据框。

01

R数据科学整洁之道：使用dplyr操作数据表

dplyr 是 tidyverse 包的一部分，提供了许多操作数据框的工具，常用的有：

03

R&Python Data Science 系列：数据处理（3）

排序函数，按照某（几）个指定的列按照升（降）序排列重新排列数据集，参数ascending = False，降序排列，ascending = True，升序排列；

02

生信代码：数据处理（ tidyverse包）

大家在学习R语言的时候，大多参考《R语言实战》这本书，但这本书年代过于久远（中文第二版是2016年），主要着力点也是在R base上，R语言可视化的ggplot2包也只是简要介绍，而对于tidyverse包，《R语言实战》并未涉及，这也导致R语言的学习难度增加，今天我们给大家引入tidyverse包的学习。

01

「R」数据操作（七）：dplyr 操作变量与汇总

除了选择已存在的列，另一个常见的操作是添加新的列。这就是mutate()函数的工作了。

02

东哥陪你学PowerBI——通过RFM模型分析客户价值

本章通过分析某店铺会员消费数据，将每个会员的R、F、M得分值与平均值做对比（每个要素好于平均值记为A，比平均值差记为B），将会员分为以下八种，以便针对性做营销决策，实现精细化运营

03

Power BI: 理解SUMMARIZE

SUMMARIZE执行两个操作：按列分组和添加值列。使用SUMMARIZE对表进行分组是一个安全的操作，而使用SUMMARIZE添加新的列可能会导致难以调试的意外结果。

03

35. R 数据整理（七：使用tidyr和dplyr处理数据框 2.0）

假设数据以 tibble 格式保存。数据集如果用于统计与绘图，需要满足一定的格式要求，(Wickham, 2014) 称之为整洁数据 (tidy data)，基本要求是每行一个观测，每列一个变量，每个单元格恰好有一个数据值。这些变量应该是真正的属性，而不是同一属性在不同年、月等时间的值分别放到单独的列。

03

Python从零开始第三章数据处理与分析python中的dplyr（5）目录

===============================================

03

【大招预热】—— DAX优化20招！！！

—— —— —— —— —— —— —— —— —— —— —— —— —— —— —— —— —

03

Power Pivot中3大汇总函数对比解释及使用介绍

1. Summarize A. 语法 SUMMARIZE (

, <GroupBy_ColumnName> [, [<Name>] [, [<Expression>] [, <GroupBy_ColumnName> [, [<Name>] [, [<Expression>] [, … ] ] ] ] ] ] ) 位置参数描述第1参数 Table 需要操作的表第2参数 GroupBy_ColumnName 分组的依据(可以有多个) 可选第3参数 Name 分组后的新列名，可以有多个汇总

02

BI技巧丨粒度切换

但是实际使用上，二者还有一个核心的关键点，就是GENERATE函数可以传递第一参数的上下文，而CROSSJOIN函数不能传递第一参数上下文。

02

R数据科学|3.6内容介绍

上节我们对选择现有的列和使用mutate添加新列做了介绍。现在对数据框使用summarize()进行分组摘要进行介绍。函数功能：summarize()可以将数据框折叠成一行：

02

Rust学习笔记之泛型、trait 与生命周期

今天，我们继续「Rust学习笔记」的探索。我们来谈谈关于「Rust学习笔记之泛型、trait 与生命周期」的相关知识点。

02

销售需求丨多列判定筛选(一）

在实际做报表中，我们经常能遇到一些特殊情况需要我们对一张表来进行筛选。最开始白茶写的几期文章，讲解过利用CALCULATE函数和FILTER函数的筛选求和模式，但是当时的思路是限定一个点。比如说我有一份销售退货表，限定条件是“销售”，我不想知道退货的情况。这些都属于单点限制，利用的是“=”取值来判定。

03

SUMMARIZE函数解决之前的总计错误

这些都是之前的文件，这里拿出来是为了方便小伙伴们观看对比使用的。先来说一下什么意思：

03

左手用R右手Python系列6——变量计算与数据聚合

R语言与Python的Pandas中具有非常丰富的数据聚合功能，今天就跟大家盘点一下这些函数的用法。 R语言： transform mutate aggregate grouy_by+summar

07

PowerBI DAX 新函数 OFFSET

如果我们希望在透视表的另一列可以获取前一列的上一项的值，该怎么做呢？这个问题在以前需要做定位。而有了新的函数 OFFSET 可以简化这个过程。如下：

02

BI-SQL丨JOIN

在PowerBI中也有类似的概念，比如可以通过GENERATE函数和CROSSJOIN函数可以组成笛卡尔积，可以通过RELATED返回多端的维度。最直观类似的，是白茶之前描述的《INTERSECT函数》。

00

函数周期表丨添加列

可以很清楚的看到，新增的计数列每一行的结果都是总计行数，很明显没有进行上下文转换。

03

Power Pivot中3大汇总函数的配套组合函数

如果和ROLLUPISSUBTOTAL和ISSUBTOTAL函数一起使用，参数要一致

02

R语言日常笔记（2）distinc函数

从结果发现d1也就是用match的速度非常快！而在tidyverse方法中， d3的summarize显然更好。

03

Power BI：在DAX中转移筛选器

文章背景：最近在学习DAX权威指南的第15章，高级关系。在某些情况下，我们很难在两个实体之间创建物理关系。可喜的是，DAX表达式有多种方式模拟这种关系。

02

R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)

大型数据集通常是高度结构化的，结构使得我们可以按不同的方式分组，有时候我们需要关注单个组的数据片断，有时需要聚合不同组内的信息，并相互比较。

03

「R」数据操作（四）：初学者学习tidyverse

tidyverse是一组处理与可视化R包的集合（人称“极乐净土”，但我并不喜欢这个称呼），其中ggplot2与dplyr最广为人知。

03

R︱高效数据操作——data.table包（实战心得、dplyr对比、key灵活用法、数据合并）

由于业务中接触的数据量很大，于是不得不转战开始寻求数据操作的效率。于是，data.table这个包就可以很好的满足对大数据量的数据操作的需求。

04

R语言 | 第一部分：数据预处理

1.创建数据集/矩阵【data.frame数据框、matrix矩阵、array数组】

00

【R语言】基础知识|dplyr管道函数处理表格

data<-read_excel("~/Desktop/Excel学习/表姐牌口罩销售数据.xlsx")

03

R语言 | 第一部分：数据预处理

1.创建数据集/矩阵【data.frame数据框、matrix矩阵、array数组】

02

「Workshop」第二期：程序控制与数据操作流

《R for Data Science》: http://r4ds.had.co.nz/

03

数据处理|R-dplyr

arrange函数按给定的列名进行排序，默认为升序排列，也可以对列名加desc()进行降序排序。

01

如何在矩阵的行上显示“其他”【3】切片器动态筛选的猫腻

那么我们基本上可以得出结论了：数据表是由子类别和年度组合构成，把每年的子类别对应的销售额放进去，通过筛选年度切片器，达到选择不同年份时显示不同的销售额。

02

R语言包_plyr

不再是循环，而是向量操作，这个包的目的是简化apply类函数。其相当于split和apply函数的整合。

02

R语言中的非线性分类

你可以在这篇文章中找到8种在R语言中实现的非线性方法，每一种方法都做好了为你复制粘贴及修改你问题的准备。

函数周期表丨信息丨值丨CONTAINS

这是白茶随机模拟的一份数据，一份事实表，一份维度表，从例子中我们能看出来，维度并不是完全对应事实例子的。

03

机器学习-R-特征选择

特征选择是实用机器学习的重要一步，一般数据集都带有太多的特征用于模型构建，如何找出有用特征是值得关注的内容。 1. Feature selection: All-relevant selection with the Boruta package 特征选择两种方法用于分析：（1）最少最优特征选择（minimal-optimal feature selection)识别少量特征集合（理想状况最少）给出尽可能优的分类结果；（2）所有相关特征选择（all-relevant feature selection

08

《高效R语言编程》6--高效数据木匠

将你的数据整理好是一个可敬的、某些情况下是至关重要的技能，所以作者使用了数据木匠这个词。这是本书最重要的一章，将涉及以下内容：

02

东哥陪你学DAX——Values

不管是列或表，只要有重复值，Values就能把它们给挤掉，保证在给你的返回结果里，一个萝卜一个坑

02

函数周期表丨筛选丨表丨ADDMISSINGITEMS

从本期开始，白茶会开始梳理筛选器函数，坦白说，这一部分的函数有一些晦涩难懂，即使用咱的中国话来说，白茶也是觉得比较拗口的。

00

R入门？从Tidyverse学起！

很多人推荐《R语言实战》这本书来入门R，当然，这本书非常不错，我也是通过这本书开始接触的R。这种入门的学习路径属于base R first，学习的流程基本是先了解变量的类型、数据的结构，再深入点就会学到循环与自定义函数。有些类似于先认识编程，再按照数据处理、可视化、统计分析等应用方向开始下一个学习的旅程。

03

Day6-学习R包

Dplyr是一个强大的R数据处理基础软件包,用于处理,清理和汇总非结构化数据。Dplyr函数处理速度比基本R函数快。这是因为Dplyr函数是以计算有效的方式编写的。

02

一步一步教你制作销售目标分析报告

前面的文章中我已经使用了一个入门案例动态销售报告来带领大家入门PowerBI的入门学习，基于动态销售报告，我可以在来进行细化处理销售目标表中的数据。本文的主题就是销售目标的分析。我们都知道销售目标是销售的起点，销售人员每天的跟进都可以来反映销售目标完成情况。因此，将销售目标的颗粒度细化到每一天很有必要。　　销售目标的细化主要的难点在于许多的企业在销售业务中有季节性。比如说在相同的月份中，去年的2月和今年的2月可能天数不同，无法全部复制。还有就是月份中的周末时间，有些月份存在4个周末，有些月份存在5个周末。这些时间因素都会对销售趋势造成一定的影响。　　回到数据源结构，我们回顾一下动态销售报告中的销售明细数据。这个表中有销售日期和销售额，我们可以使用DAX函数来将销售目标处理到该表的汇总数据表中。接下就一起来处理数据吧。在PowerQuery中手动输入销售目标表

02

tidyverse|数据分析常规操作-分组汇总（sumamrise+group_by)

汇总函数 summarise()，可以将数据框折叠成一行 ,多与group_by()结合使用

06

销售需求丨多列判定筛选(二）

哈喽，小伙伴们，还记得之前白茶曾经写过《多列判定筛选》么？就是当有多个需要判定的列，如何去虚拟表中进行范围判定而进行取值。当时白茶采用的方法是利用SUMMARIZE函数和IN的组合模式。本期呢，就着这个问题咱们来探讨第二种解决方案。

05

一个简单现实案例挑战 PowerBI 水平测试 - 深度解析

每个门店由店长管理，店长的管理被评价得到KPI。现在希望按照如下结构显示，该如何实现？

03

scRNA复现|所见即所得，和Cell学umap，plot1cell完成惊艳的细胞注释umap图

单细胞常见的可视化方式有DimPlot，FeaturePlot ，DotPlot ，VlnPlot 和 DoHeatmap集中，在Seurat中均可以实现，但文献中的图大多会精美很多。之前 scRNA分析 | 定制美化FeaturePlot 图，你需要的都在这介绍了FeaturePlot的美化方式。在跟SCI学umap图| ggplot2 绘制umap图，坐标位置，颜色，大小还不是你说了算介绍过DimPlot的一些调整方法，本次再介绍一种更惊艳的umap图。

04

R︱sparkR的安装与使用、函数尝试笔记、一些案例

本节内容转载于博客： wa2003 spark是一个我迟早要攻克的内容呀~ ————————————————————————————————————— 一、SparkR 1.4.0 的安装及使用 1、./sparkR打开R shell之后，使用不了SparkR的函数装在了 /usr/local/spark-1.4.0/ 下 [root@master sparkR]#./bin/sparkR 能进入R，和没装SparkR的一样，无报错 > library(SparkR) 报错： Error i

05

R语言学习笔记之——数据处理神器data.table

数据处理在数据分析流程中的地位相信大家都有目共睹，也是每一个数据从业者面临的最为繁重的工作任务。在实际应用场景下，虽然SQL（SQL类专业的etl语言）是数据处理的首选明星语言，性能佳、效率高、容易培养数据思维，但是SQL没法处理构建全流程的数据任务，之后仍然需要借助其他数据分析工具来对接更为深入的分析任务。 R语言作为专业的统计计算语言，数据处理是其一大特色功能，事实上每一个处理任务在R语言中都有着不止一套解决方案（这通常也是初学者在入门R语言时，感觉内容太多无从下手的原因），当然这些不同方案确实存在

08

太赞了，这4款Pandas自动数据分析神器

我们做数据分析，在第一次拿到数据集的时候，一般会用统计学或可视化方法来了解原始数据。

02

4 款 Pandas 自动数据分析神器，yyds！

我们做数据分析，在第一次拿到数据集的时候，一般会用统计学或可视化方法来了解原始数据。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭