首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

使用dplyr::summarise()将字符串向量用作函数中的变量

使用dplyr::summarise()函数可以对数据进行汇总统计操作。该函数可以接受字符串向量作为参数,并将其作为函数中的变量使用。

具体而言,dplyr::summarise()函数用于对数据进行分组汇总操作,可以计算各种统计指标,如求和、平均值、中位数、最大值、最小值等。它可以接受多个参数,其中包括字符串向量,用于指定需要进行汇总统计的变量。

使用字符串向量作为函数参数的好处是可以动态地指定变量,使得代码更加灵活和可复用。通过将字符串向量传递给dplyr::summarise()函数,可以在不修改代码的情况下对不同的变量进行汇总统计。

以下是一个示例代码,展示了如何使用dplyr::summarise()函数将字符串向量用作函数中的变量:

代码语言:txt
复制
library(dplyr)

# 创建一个示例数据框
data <- data.frame(
  group = c("A", "A", "B", "B", "C", "C"),
  value1 = c(1, 2, 3, 4, 5, 6),
  value2 = c(7, 8, 9, 10, 11, 12)
)

# 定义一个字符串向量,用于指定需要进行汇总统计的变量
variables <- c("value1", "value2")

# 使用dplyr::summarise()函数进行汇总统计
result <- data %>%
  group_by(group) %>%
  summarise(across(all_of(variables), list(mean = mean, sum = sum)))

# 输出结果
print(result)

在上述示例中,我们首先创建了一个示例数据框data,其中包含了group、value1和value2三个变量。然后,我们定义了一个字符串向量variables,其中包含了需要进行汇总统计的变量名。最后,我们使用dplyr::summarise()函数对数据进行分组汇总操作,计算了value1和value2两个变量的均值和总和,并将结果存储在result中。

需要注意的是,上述示例中使用的是R语言的dplyr包中的summarise()函数,而非其他编程语言或云计算平台中的同名函数。对于其他编程语言或云计算平台,可以根据具体情况选择相应的函数或工具进行数据汇总统计操作。

推荐的腾讯云相关产品和产品介绍链接地址:

  • 腾讯云数据库(TencentDB):https://cloud.tencent.com/product/cdb
  • 腾讯云服务器(CVM):https://cloud.tencent.com/product/cvm
  • 腾讯云人工智能(AI):https://cloud.tencent.com/product/ai
  • 腾讯云物联网(IoT):https://cloud.tencent.com/product/iotexplorer
  • 腾讯云移动开发(移动推送):https://cloud.tencent.com/product/umeng
  • 腾讯云存储(COS):https://cloud.tencent.com/product/cos
  • 腾讯云区块链(BCS):https://cloud.tencent.com/product/bcs
  • 腾讯云元宇宙(Tencent XR):https://cloud.tencent.com/product/xr
页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

数据处理|R-dplyr

data(iris) #本文使用iris示例数据集。 2)数据记录筛选(行筛选) filter函数:按指定条件筛选符合条件逻辑判断要求数据记录。...arrange(iris,Sepal.Length) # 数据按照Sepal.Length升序排序 5)变量变换/重构 mulate()函数可以数据拓展,也可以在保留原变量基础上增加变量,进行数据处理...)) 利用概述函数概括数据,输入数值向量而返回单一数值: first 向量第一个值。...Min ;Max Mean ;Median ;Var ;Sd等 summarise(iris, max(Petal.Width), first(Sepal.Width)) #返回数据框变量最大值及第一四分位值...11)数据合并 dplyr也添加了类似cbind()函数和rbind()函数功能函数,它们是bind_cols()函数和bind_rows()函数

1.9K10

R 数据整理(七:使用tidyr和dplyr处理数据框 2.0)

指定变量名时不是写成字符串形式而是直接写变量名: d.class %>% distinct(sex, age) %>% knitr::kable() 如果希望保留数据框其它列,可以加选项 keep_all...) rename() 这个函数可能出现在其它包,保险起见写成 dplyr::rename()。...按列号 select(test,1) select(test,c(1,5)) 按列名 如果想要用向量来存放希望筛选列名,需要使用函数 one_of 来存放该向量。...dplyr summarse_at() 函数可以指定一批变量名与一批统计函数,自动命名结果变量,如: d.cancer %>% summarise_at( c("v0", "v1"), list(...nest 和 unnest 函数,可以子数据框保存在 tibble ,可以保存在 tibble 子数据框合并为一个大数据 框。

10.7K30

函数冲突报错就完了吗

比如,我在使用如下函数时候,报错: > showDatabaseCategory(CellChatDB) Error: Problem with `summarise()` input `value`.../library) 果然,绝大部分情况下,这个 summarise函数应该是来自于dplyr包,但是它排名很靠后。...但是我使用是showDatabaseCategory函数,它里面封装summarise函数我是无权修改,我没办法跟之前:R语言繁荣背后何尝没有隐患,那样通过指定某个R包某个函数方法来解决报错...所以我使用代码 library(dplyr) 重新加载了一下 dplyr包,提升了它优先级。 这样代码就不会报错啦。 机智如我!...,字符,逻辑,因子) 多种数据结构(向量,矩阵,数组,数据框,列表) 文件读取和写出 简单统计可视化 无限量函数学习

1.1K20

生信学习-Day6-学习R包

在这个特定例子向量 vars 包含了两个元素,它们都是字符串:"Petal.Length" 和 "Petal.Width"。这两个字符串通常对应于数据框列名。...这样做目的通常是为了在后续函数调用简化代码,特别是在你想要操作数据框特定列时。 这会从 your_data_frame 数据框中选择列名与 vars 向量字符串相匹配列。...在dplyrfilter()函数使用时,它可以用于筛选数据框匹配给定集合任一值行。这行代码作用如下: filter(test, ...): 在test数据框筛选行。...test1 <-: 这是R语言中赋值操作符,用于data.frame()函数创建数据框赋值给变量test1。...这意味着函数查找 test1 和 test2 列名为 "x" 列,并基于这两列匹配值来合并行。只有当两个数据框中都存在列 "x" 且某些行在这一列值相等时,这些行才会出现在最终结果

16010

Day6——R包

BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") install.packages("dplyr")library(dplyr)dplyr五个基础函数示例数据...,select不能直接使用字符向量筛选,需要使用one_of函数R语言中使用vars参数指定数据框需要分析字段索引范围在R语言中,我们经常需要对数据框进行分析和处理。...数据框是一种二维表格结构,其中包含了多个变量(字段)和观测值(行)。在进行数据分析时,有时我们只对数据框特定字段感兴趣,而不需要使用所有的字段。...这时,我们可以使用vars参数来指定需要分析字段索引范围,从而提取出感兴趣字段进行后续操作。vars参数是dply包select函数一个参数,它允许我们通过指定字段索引范围来选择需要字段。...setosa","versicolor行#%in%判断前面一个向量元素是否在后面一个向量,返回布尔值。

13810

教你几招R语言中聚合操作

在R语言中提供了几种实现数据聚合常用函数,它们分别是基于stats包aggregate函数、基于sqldf包sqldf函数以及基于dplyrgroup_by函数和summarize函数。...:指定FUN函数其他参数值; simplify:bool类型参数,是否聚合结果以简洁向量或矩阵形式输出,默认为TRUE; drop:bool类型参数,是否删除无用组合值(即通过by参数完成变量组合...SQL语句; stringsAsFactors:bool类型参数,是否字符型变量转换为因子型变量,默认为FALSE; row.names:bool类型参数,是否保留数据框行名称,默认为FALSE...基于group_by和summarize函数聚合 ---- 结合dplyrgroup_by函数和summarize函数实现数据分组聚合可以避开aggregate函数和sqldf函数一些缺点,...:指定数据库哪些变量需要用作分组变量; add:bool类型参数,是否在已分组数据框上再添加group_by分组设置,默认为FALSE;summarise(.data, ...) .data:

3.3K20

tidyverse:R语言中相当于pythonpandas+matplotlib存在

library(tidyverse) #加载以下tidyverse核心packages: ggplot2:画图,可视化数据 dplyr:操控数据,过滤、排序等 tidyr:清理数据 readr:(...——左侧值应用到右侧数据data位置 管道函数在tidyverse,管道符号是数据整理主力,可以把许多功能连在一起,而且简洁好看,比起R基本代码更加容易阅读!...:数据整理 dplyr下述五个函数用法 4.1 筛选: filter 4.2 排列: arrange 4.3 选择: select 4.4 变形: mutate 4.5 汇总: summarise...#key:原数据框所有列赋给一个新变量key #value:原数据框所有值赋给一个新变量value #…:可以指定哪些列聚到同一列 #na.rm:是否删除缺失值 widedata <-...:新建列名,为字符串向量 #sep:被拆分列分隔符 #remove:是否删除被分割列 widesep <- separate(wideunite, information,c("person"

3.9K10

R数据科学-1(dplyr

两个软件包命令都可以与管道函数(%>%)很好地配合使用,这可以使代码更具可读性。详细内容可参考Cheatsheet手册。...但是往往会打印出来很长,tidyrtibble就解决了此问题,直接简单看到数据结构及变量类型。...head(mtcars),可以看到数据前面6行,属于数据一个预览。但是看不到各个列属性。 %>%管道函数,其实就是f()写在了数据后面,下面示例两个操作,都得到df,效果一样。...# … with 22 more rows 3.数据-变量条件筛选 dplyr::filter()函数对上述新产生变量数据df,进行筛选。...,或者看gear不同水平下最大值最小值,那么就用到group_by()与 summarise() 函数

1.6K20

R语言宏基因组学统计分析(第四章)笔记

原来图函数用错了,是boxplot ? 可以使用ggplot2画更高品质图。...(如一个样本种级别表包含多个相同名称种);2、另一个原因是让函数不试图去修正种名字,来保证系统上正确(否则,名字空间可能变为.)。...,升序,可以认为x[order(x)]=sort(x) ifelse()R语言是向量,ifelse()可以遍历所有因子并避免使用循环,根据前面我们知道,循环调用函数次数超级多的话会让时间明显变长。...)))),rep("cecal", length(grep("CeSt", colnames(tab)))))) 4.2 dplyr包简介 dplyr包提供了一系列数据操纵函数,是plyr包第二版,...()创建新列, 例如, 通过已有变量,调用函数增加新变量 summarise() 汇总数值 group_by() 分组观察值,分开和合并 sample_n() 和 sample_frac() 随机抽样

1.7K20

「R」dplyr 列式计算

❝在近期使用dplyr」 进行多列选择性操作,如 mutate_at() 时,发现文档提示一系列dplyr函数变体已经过期,看来后续要退休了,使用 across() 是它们统一替代品,所以最近抽时间针对性学习和翻译下...然后我们展示一些其他动词使用。..._if, _at, _all 「dplyr」 以前版本允许以不同方式函数应用到多个列:使用带有_if、_at和_all后缀函数。这些功能解决了迫切需求而被许多人使用,但现在被取代了。...这使 「dplyr」 更容易使用(因为需要记住函数更少),也使我们更容易实现新动词(因为我们只需要实现一个函数,而不是四个)。..._at() 函数是 「dplyr唯一你需要手动引用变量地方,这让它们比较奇怪且难以记忆。 为什么过了这么久才发现 across()?

2.4K10

「R」dplyr 行式计算

这篇文章,我们学习围绕rowwise() 创建 row-wise 数据框 dplyr 操作方法。 本文讨论 3 种常见使用案例: 按行聚合(例如,计算 x, y, z 均值)。...你可以在 rowwise() 中提供“标识符”变量,这些变量将在你调用 summarise() 时候保留,因此它行为类似于变量传入 group_by(): df <- tibble(name =...mutate() 列切分然后传入 length(y) 时候,分组 mutate 使用 [ 操作,而行式 mutate 使用 [[。...rowwise()不仅适用于返回长度为1向量函数(又名总结函数);如果结果是列表,它可以与任何函数一起工作。...作为替代方案,我们建议使用 purrr map() 函数执行逐行操作。但是,这很有挑战性,因为您需要根据变化参数数量和结果类型来选择映射函数,这需要相当多 purrr 函数知识。

6.2K20

数据清洗与管理之dplyr、tidyr

缺失值 5 dplyr下述五个函数用法 5.1 筛选: filter 5.2 排列: arrange 5.3 选择: select 5.4 变形: mutate 5.5 汇总: summarise...包下述五个函数用法【高级数据管理包】 # install.packages("dplyr") library(dplyr) #使用datasets包mtcars数据集做演示,首先将过长数据整理成友好...,左侧数据结果传递到右侧,作为右侧处理原始数据 #当对数据集通过group_by()添加了分组信息后,mutate(),arrange() 和 summarise() 函数会自动对这些 tbl 类数据执行分组操作...key #value:原数据框所有值赋给一个新变量value #…:可以指定哪些列聚到同一列 #na.rm:是否删除缺失值 widedata <- data.frame(person=c('Alex...:新建列名,为字符串向量 #sep:被拆分列分隔符 #remove:是否删除被分割列 widesep <- separate(wideunite, information,c("person"

1.8K40

R tips:使用!!来增加dplyr可操作性

这种易用性是有代价,假如想要对分析工作稍微增加一些编程属性时,就会发现dplyr异常情况,比如分组变量赋值给一个变量使用变量来进行分组: ### 分组变量group_var无法完成工作 group_var...这些函数在rlang包中有更加系统相同角色存在:parse对应函数是parse_expr(语句还重新变为字符串使用expr_text)。...辅助dplyr完成编程工作 上面的例子,之所以group_var不起作用,是因为dplyr直接group_var当做变量名,然后去mtcars寻找名字叫做group_var列,这肯定是会报错。...在mutate完成新变量编程 假如想要在mutate中使用变量对新变量进行设置,其结果并不会如愿,比如,变量名var_name赋值为“gear_new",使用var_name进行mutate操作...PS:对于ggplot2而言也是一样,它aes也是不能直接使用变量传入列名,如果想要使用赋值了字符串变量来传值的话,可以如上述操作。 但是也有更简单办法,它是?

2.2K31

tidyverse|数据分析常规操作-分组汇总(sumamrise+group_by)

一 summarize汇总 汇总函数 summarise(),可以数据框折叠成一行 ,多与group_by()结合使用 1.1 summarise完成指定变量汇总 统计均值,标准差,最小值,个数和逻辑值...: any(), all() 1.2 , summarise_if完成一类变量汇总 iris %>% summarise_if(is.numeric, ~ mean(., na.rm...完成指定变量汇总 summarise_at配合vars,可以更灵活筛选符合条件列,然后进行汇总 iris %>% summarise_at(vars(ends_with("Length")...() 组合构成了使用 dplyr 包时最常用操作之一:分组摘要 2.1 按照Species分组,变量汇总 iris %>% group_by(Species) %>% summarise...#1 setosa 50 #2 versicolor 50 #3 virginica 50 2.3 逻辑值计数和比例 当与数值型函数一同使用时, TRUE 会转换为 1,

2.4K60

Day6 呦呦鹿鸣—学习R包

iris可知其为150×5列表dplyr五个基础函数1.mutate(),新增列mutate(test, new = Sepal.Length * Sepal.Width)mutate(df, z =...使用实用性强\ 多个值减少到单个值summarise(test, mean(Sepal.Length), sd(Sepal.Length)) # 计算Sepal.Length平均值和标准差summarise...), sd(Sepal.Length))R管道操作符2:count统计某列unique值count(test,Species)分类变量每个变量频数dplyr处理关系数据2个表进行连接1.內连...inner_join,取交集inner_join(test1, test2, by = "x")满足两个条件:有相同变量名,相同变量列里有相同元素;2.左连left_join列表书写顺序决定了最终合成列表顺序...= 'x')6.简单合并bind_rows(test1,test2)函数需要两个表格列数相同bind_cols(test1,test2)函数则需要两个数据框有相同行数思维导图生信星球打卡任务,菜鸟一枚

13910
领券