在dplyr包中使用summarise和across，同时区分数字列和非数字列_使用median和mean计算的PySpark空值能够处理pyspark数据帧中的非数字列_在excel中如何使用python拆分数字值和字符值以及如何附加到不同列中 - 腾讯云开发者社区

在dplyr包中使用summarise和across，同时区分数字列和非数字列

在dplyr包中，summarise和across是用于数据汇总和处理的两个重要函数。它们可以帮助我们对数据进行聚合计算，并且可以同时对数字列和非数字列进行不同的操作。

首先，summarise函数用于对数据进行聚合计算，返回一个包含汇总结果的数据框。它可以接受多个参数，其中每个参数都是一个聚合函数，用于对指定的列进行计算。常见的聚合函数包括sum、mean、median、min、max等。

举个例子，假设我们有一个包含学生成绩的数据框，其中包含了学生的姓名、科目和成绩。我们可以使用summarise函数计算每个科目的平均成绩：

library(dplyr)

# 假设数据框名为df，包含列name、subject和score
df %>%
  group_by(subject) %>%
  summarise(avg_score = mean(score))

在上面的例子中，我们使用group_by函数对数据按照科目进行分组，然后使用summarise函数计算每个科目的平均成绩，并将结果保存在avg_score列中。

接下来，across函数可以用于同时对多个列进行相同的操作。它可以接受多个参数，其中每个参数都是一个列选择器，用于指定要操作的列。常见的列选择器包括all_of、starts_with、ends_with、contains等。

举个例子，假设我们有一个包含学生信息的数据框，其中包含了学生的姓名、年龄和性别。我们可以使用across函数将所有的字符列转换为大写：

library(dplyr)

# 假设数据框名为df，包含列name、age和gender
df %>%
  mutate(across(where(is.character), toupper))

在上面的例子中，我们使用where函数选择所有的字符列，然后使用across函数将这些列中的值转换为大写。

需要注意的是，summarise和across函数可以结合使用，以实现对不同类型的列进行不同的操作。例如，我们可以对数字列计算平均值，对字符列计算出现次数：

library(dplyr)

# 假设数据框名为df，包含列name、age和gender
df %>%
  summarise(across(where(is.numeric), mean),
            across(where(is.character), ~length(unique(.))))

在上面的例子中，我们使用where函数选择所有的数字列，并使用mean函数计算它们的平均值；然后使用where函数选择所有的字符列，并使用匿名函数计算它们的唯一值个数。

总结起来，summarise和across函数是dplyr包中用于数据汇总和处理的重要函数。它们可以帮助我们对数据进行聚合计算，并且可以同时对数字列和非数字列进行不同的操作。

腾讯云相关产品和产品介绍链接地址：

腾讯云计算服务：https://cloud.tencent.com/product/cvm
腾讯云数据库服务：https://cloud.tencent.com/product/cdb
腾讯云服务器运维服务：https://cloud.tencent.com/product/cds
腾讯云音视频处理服务：https://cloud.tencent.com/product/mps
腾讯云人工智能服务：https://cloud.tencent.com/product/ai
腾讯云物联网服务：https://cloud.tencent.com/product/iotexplorer
腾讯云移动开发服务：https://cloud.tencent.com/product/mobdev
腾讯云存储服务：https://cloud.tencent.com/product/cos
腾讯云区块链服务：https://cloud.tencent.com/product/baas
腾讯云元宇宙服务：https://cloud.tencent.com/product/vr

在dplyr包中使用summarise和across，同时区分数字列和非数字列

相关·内容

「R」dplyr 列式计算

dplyr_下篇

R语言基于dplyr实现数据快捷操作

dplyr中的across操作

「R」dplyr 行式计算

dplyr中的行操作

dplyr_new version-across

玩转数据处理120题｜R语言版本

DAY06-R包学习

Day-6 香波🐟

DAY6-学习R包

R 数据整理（七：使用tidyr和dplyr处理数据框 2.0）

生信学习小组Day6笔记—Chocolate Ice

学习R包

数据清洗与管理之dplyr、tidyr

玩转数据处理120题｜Pandas&R

生信学习-Day6-学习R包

Day6-蓝色柠檬

Day6 呦呦鹿鸣—学习R包

R||R语言基础（三）_R包

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐