开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何使用dplyr引用变量而不是列

dplyr是一个在R语言中用于数据处理和操作的强大包。它提供了一组简洁且一致的函数，可以轻松地对数据进行筛选、排序、分组、汇总等操作。

在dplyr中，我们可以使用引用变量而不是列名来操作数据。这可以通过使用{{}}符号来实现。{{}}符号允许我们在dplyr函数中引用变量，而不是直接使用列名。

下面是一个示例，展示了如何使用dplyr引用变量而不是列：

library(dplyr)

# 创建一个示例数据框
data <- data.frame(
  name = c("Alice", "Bob", "Charlie"),
  age = c(25, 30, 35),
  salary = c(5000, 6000, 7000)
)

# 定义一个函数，用于根据给定的变量名对数据进行分组并计算平均值
calculate_average <- function(data, variable) {
  data %>%
    group_by({{ variable }}) %>%
    summarise(average_salary = mean(salary))
}

# 使用函数计算不同年龄段的平均工资
result <- calculate_average(data, age)
print(result)

# 使用函数计算不同姓名的平均工资
result <- calculate_average(data, name)
print(result)

在上面的示例中，我们首先创建了一个示例数据框data，其中包含了姓名、年龄和工资三列。然后，我们定义了一个名为calculate_average的函数，该函数接受一个数据框和一个变量名作为参数。函数内部使用{{}}符号来引用变量，并使用group_by和summarise函数对数据进行分组和计算平均值操作。最后，我们分别使用age和name作为变量调用calculate_average函数，并打印结果。

这种使用dplyr引用变量而不是列的方法可以使代码更加灵活和可重用。无论是对于数据处理还是其他操作，都可以根据需要动态地选择变量，而不需要硬编码列名。

腾讯云提供了一系列与云计算相关的产品和服务，其中包括云服务器、云数据库、云存储等。您可以通过访问腾讯云官方网站（https://cloud.tencent.com/）了解更多关于腾讯云的信息和产品介绍。

相关搜索:Javascript DOM变量是引用而不是复制 Python -使用str()而不是引号引用dataframe列 Python dataclasses.dataclass引用变量而不是实例变量 Python:如何让变量引用对象本身而不是对象的值？rowindex使用变量而不是硬编码使用AND而不是OR搜索列使用symget而不是带&的取消引用使用vm而不是$scope引用指令属性告诉display使用标量而不是变量在dplyr链期间在行级而不是列级进行转换

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

PowerBI DAX 如何使用变量表里的列

很多时候，我们可能需要使用变量表中的列，例如： VAR vTable = FILTER( 'Order' , [Discount] 0 ) 这里定义了一个 vTable 表示订单中没有折扣的那些订单...如果希望使用基表中列，可以使用这样的语法：表[列] 因此， VAR vResult = SUM( 'Order'[LineSellout] ) 是有效的正确语法，而 VAR vResult = SUM...如果希望使用非基表中的列，则不可以直接引用到，要结合具体的场景来选择合适的函数。...聚合运算如果希望直接进行聚合运算，则： VAR vResult = SUMX( vTable , [LineSellout] ) 这里的 vTable 作为表使用，而 [LineSellout] 作为其中的列被引用到...LineSellout] 并不是合理的引用。

4.2K1 0

R︱高效数据操作——data.table包（实战心得、dplyr对比、key灵活用法、数据合并）

data.table中，还有一个比较特立独行的函数：使用:=引用来添加或更新一列（参考：R语言data.table速查手册） DT[, c("V1","V2") := list(round(exp(V1..., -State) dplyr中是arrange函数，而data.table是setorder函数，同时降序的方式。...dplyr的降序是，arrange(data,desc(x))，而data.table的降序是setorder(data,-x) ———————————————————————————————————...—————————————————————— 实战一：在data.table如何选中列，如何循环提取、操作data.table中的列？...2016-11-28补充：留言区大神给了一个比较好的选中列的方式，其中主要就是对with的使用： data.table取列时，可以用data[,1,with=FALSE]取data的第一列

7.8K4 3

R tips：使用!!来增加dplyr的可操作性

dplyr包在数据变换方面非常的好用，它有很多易用性的体现：比如书写数据内的变量名时不需要引号包裹，也不需要绝对引用，而这在多数baseR函数中都不是这样的，比如： library(tidyverse)...如何使用!!...，结果却发现新变量为var_name，而不是我们想要的gear_new。....data) #使用enexpr而不是ensym，因为后边调用时传入的实参是mtcars[1:6, group_v]，它是一个语句，而不是symbol for (i in seq_along(.vars...sym(paste0(var,"_new"))使用sym，而不是expr，是由于有!!

2.3K3 1

「R」dplyr 列式计算

最后我们将简要介绍一下历史，说明为什么我们更喜欢 across() 而不是后一种方法（即 _if(), _at(), _all() 变体函数）以及如何将你的旧代码转换为新的语法实现。..._if, _at, _all 「dplyr」以前的版本允许以不同的方式将函数应用到多个列：使用带有_if、_at和_all后缀的函数。这些功能解决了迫切的需求而被许多人使用，但现在被取代了。...这使「dplyr」更容易使用（因为需要记住的函数更少），也使我们更容易实现新的动词（因为我们只需要实现一个函数，而不是四个）。..._at() 函数是「dplyr」中唯一你需要手动引用变量名的地方，这让它们比较奇怪且难以记忆。为什么过了这么久才发现 across()？...我们可以使用没有外部名称作为将数据框列解包为单独列的约定。你如何转移已经存在的代码？

2.4K1 0

R语言列筛选的方法--select

我们知道，R语言学习，80%的时间都是在清洗数据，而选择合适的数据进行分析和处理也至关重要，如何选择合适的列进行分析，你知道几种方法？如何优雅高效的选择合适的列，让我们一起来看一下吧。 1....使用R语言默认的方法：列选择这一种，当然是简单粗暴的方法，想要哪一列，就把相关的列号提取出来，形成一个向量，进行操作即可。...像这种情况，解决办法有两种： 5.1 绝对引用函数即使用select时，要用dplyr::select a3 = a2 %>% dplyr::select(ID,F1,y1,y2,y3) 这样也比较麻烦...5.2 放到环境变量中「推荐的方法：」 r$> select = dplyr::select r$> a3 = a2 %>% select(ID,F1,y1,y2,y3) 推荐在载入包时，将下面代码放在开头...，就可以肆无忌惮的应用select了，毕竟，环境变量的优先级是第一位的。

7.6K3 0

生信代码：数据处理（ tidyverse包）

dplyr包下主要是以下几个操作: select()——选择列 filter/slice()——筛选行 arrange()——对行进行排序 mutate()——修改列/创建列 summarize(...1 mutate() mutate（）与基础函数transform（）相似，都可以添加新的一列，但是允许引用刚刚创建的列： mydata % mutate(sumx=x1+x2, meanx=sumx/4)##dplyr允许使用管道%>%操作，且meanx可以引用sumx 2...，需要保存下来 5 arrange() R base包中涉及到排序的包括 sort()，rank()，order()，而在dplyr包中与排序相关的是arrange()包，默认是从高到低进行排序，如果变换排序顺序则可以使用...-(变量)或者desc(变量)。

2K1 0

「R」dplyr 行式计算

「原文来自：dplyr 文档」上一篇：「R」dplyr 列式计算通常 dplyr 和 R 更适合对列进行操作，而对行操作则显得更麻烦。...按行汇总统计 dplyr::summarise() 让一列多行的统计汇总变得非常简单，当它与 rowwise() 结合时，它也可以简便地操作汇总一行多列。...，而不是单独值的长度。...out2 <- integer(2) for (i in 1:2) { out2[[i]] <- length(df$y[[i]]) } out2 #> [1] 3 1 注意，这种魔力只适用于引用现有列时...do() 我们对 do()的必要性已经质疑了很长一段时间，因为它与其他 dplyr 动词并不太相似。它有两种主要的运作模式: 没有参数名：你可以调用函数来输入和输出数据框。引用“当前”组。

6.2K2 0

数据处理第3部分：选择行的基本和高级的方法

在这篇文章中，我们将介绍如何挑选您的数据。除了filter的基础知识外，它还介绍了一些更好的方法，用near（）和between（）挑选数字列，或用正则表达式过滤字符串列。...Basic row filters 在许多情况下，您不希望在分析中包括所有行，而只包括选择的行。仅使用特定行的函数在dplyr中称为“filter（）”。...*filter（xor（condition1，condition2）将返回只满足其中一个条件的所有行，而不是满足两个条件时。可以组合多个AND，OR和NOT条件。...描述列都是字符列，而测量数据是数字。所以使用filter_if（）我可以指定我只想过滤字符变量。在这种情况下，我只得到7行。...与上面的示例类似，如果所有列都需要返回TRUE（AND等效），则可以使用all_vars（）;如果只需要一个变量返回TRUE（OR等效），则可以使用any_vars（）。

1.3K1 0

「R」使用gt包创建表格入门

使用简单的表格展示gt基础让我们使用一个R datasets包中不是很流行的数据集islands：它是一个命名向量。...脚注位于脚部要素，它们的引用会被粘贴到单元格数据。脚注使用tab_footnote()函数添加。帮助函数cells_data()可以用于脚本靶向单元格数据的位置。...针对行，我们可以使用以列名为变量的条件语句（例如size > 15000）。这里有一个如何添加脚注的简单例子。...这里有一件事情非常需要注意：：现在只有1列（而不是两列）。...至于如何自定义组名的设定和选择，不妨发挥你们得想象力列标签类似于行组，使用tab_spanner()可以将多个列划分为不同的组。

4.4K2 1

数据清洗与管理之dplyr、tidyr

本期回顾 R语言 | 第一部分：数据预处理 R语言|第2讲：生成数据 R语言常用的数据输入与输出方法 | 第三讲本期目录 0 二维数组行列引用 1 创建新变量 2 变量重新编码 3 变量重新命名 4...例如：引用第一行数据，引用第一列数据，引用第一行第一列的数据。...通过行列值引用：数据集[行值,列值] 如行值或列值仅1个数字，表示仅引用该行或列的数据 > iris[1,] #引用第1行数据 Sepal.Length Sepal.Width Petal.Length...1列的数据，其中因数据过长，使用head()函数取前5个数字 [1] 5.1 4.9 4.7 4.6 5.0 如行值或列值为组合数据，则表示引用组合行列交叉位置的数据 > iris[1:5,1:3]...包的下述五个函数用法【高级数据管理包】 # install.packages("dplyr") library(dplyr) #使用datasets包中的mtcars数据集做演示，首先将过长的数据整理成友好的

1.8K4 0

干货 | 男朋友老是说自己R语言很6，快来用这40道题目检测他

在选项B中，分母应该是标准差而不是方差。相似地，选项C中的公式是错误的。因此，选项D是正确选择。...21 “dplyr”是R中最流行的工具包之一，它包括5个核心数据处理函数。下面选项中的哪一个不是dplyr中的核心函数？...A) select() B) filter() C) arrange() D) summary() 答案: (D) summary 是R语言基础工具包中的函数而不是dplyr中的函数。...<50) C) 以上全部 D) 以上都不是答案: (A) dplyr中的filter函数使用“,”来添加条件，而不是“&”。...使用B列中的值来表示条形图的高度。

1.9K4 0

day6-乙醇-学习R包

如何安装和加载R包 1....dplyr包的学习五个基本函数首先构建一个储存数据的变量 test 图片 mutate() 用于新增一列数据 select(),按列筛选按列号筛选按列名筛选图片 filter()筛选行图片...arrange(),按某1列或某几列对整个表格进行排序图片 arrange(),按某1列或某几列对整个表格进行排序图片 summarise()：汇总图片图片图片 dplyr两个实用技能管道操作...%>% (cmd/ctr + shift + M) count统计某列的unique值 dplyr处理关系数据內连inner_join,取交集图片左连left_join 图片全连full_join...图片半连接：semi_join 图片反连接：anti_join 图片简单合并：相当于base包里的cbind()函数和rbind()函数;注意，bind_rows()函数需要两个表格列数相同，而

1490 0

R数据科学-1（dplyr）

df以后的输出，很简洁，能看到32*11的数据行与列，也能看到各列的属性。...我们经常会用到，只需要里面的几个变量，不是所有的变量都输出。...# … with 22 more rows 3.数据-变量条件筛选 dplyr::filter()函数对上述新产生的变量的数据df，进行筛选。...使用mutate函数。可以看到mpg1与new都变成了chr与fct。提取new，看一下。...下一期介绍，如何转变行列及合并两个数据集。

1.6K2 0

数据处理|R-dplyr

1）安装、加载dplyr包、准备数据 install.packages("dplyr") #加载dplyr包使用dplyr包处理数据前，建议先将数据集转换为tbl对象。...（列） select函数:可以通过指定列名选择指定的变量进行分析，得到的为选择的列。...：Filter&Select Filter：通过一些准则选择观测值（行） Select：通过名字来选择变量（列）更名变量名： Select & Rename head(select(iris,Sepal.W...)) 利用概述函数概括数据，输入数值向量而返回单一数值： first 向量的第一个值。...注意：bind_rows()函数需要两个合并对象有相同的列数，而bind_cols()函数则需要两个合并对象有相同的行数。

1.9K1 0

R 数据整理（七：使用tidyr和dplyr处理数据框 2.0）

这些变量应该是真正的属性，而不是同一属性在不同年、月等时间的值分别放到单独的列。...我们可以使用tidyverse 系统来操作，其中包括了magrittr 包，readr 包，dplyr 包和 tidyr 包等。...指定变量名时不是写成字符串形式而是直接写变量名： d.class %>% distinct(sex, age) %>% knitr::kable() 如果希望保留数据框中其它列，可以加选项 keep_all...在 dplyr 包的 rename() 中用 “新名字 = 旧名字” 格式修改变量名，如： d2.class % dplyr::rename(h=height, w=weight...对于即将合并的新列，需要使用引号；但对于想要合并的多个列名，可以不用使用引号。sep 参数设定多列合并后不同数据分隔使用的分割符。

10.8K3 0

「R」使用gt包创建表格

使用简单的表格展示gt基础让我们使用一个R datasets包中不是很流行的数据集islands：它是一个命名向量。...我们使用dplyr根据它准备一个tibble： # 获取世界10个最大的大陆 islands_tbl <- dplyr::tibble( name = names(islands),...Wiley.") ) # Show the gt Table gt_tbl 脚注位于脚部要素，它们的引用会被粘贴到单元格数据。脚注使用tab_footnote()函数添加。...针对行，我们可以使用以列名为变量的条件语句（例如size > 15000）。这里有一个如何添加脚注的简单例子。...gt_tbl <- gt_tbl %>% tab_stubhead_label(label = "landmass") gt_tbl 这里有一件事情非常需要注意：：现在只有1列（而不是两列）

2.7K1 0

手把手教你R语言方差分析ANOVA

这些数值型变量是你要分析的目标，而分类变量则用于将数据分成不同的组。...()等函数）或进行变量选择（使用子集选择或dplyr包的select()函数）。...(变量中的水平数减1)和残差的自由度(观察总数减1和自变量中的水平数减1)； Sum Sq列显示平方和(即组均值与总体均值之间的总变化)。...；Mean Sq列是平方和的平均值，通过将平方和除以每个参数的自由度来计算；F value列是F检验的检验统计量。这是每个自变量的均方除以残差的均方。...F值越大，自变量引起的变化越有可能是真实的，而不是偶然的； Pr(>F)列是F统计量的p值。这表明，如果组均值之间没有差异的原假设成立，那么从检验中计算出的F值发生的概率大小。

1971 0

dplyr-cli：在Linux Terminal上直接执行dplyr

dplyr包的功能主要包括：变量筛选函数 select 筛选函数 filter 排序函数 arrange 变形（计算）函数 mutate 汇总函数 summarize 分组函数 group_by 多步操作连接符...另外支持两个额外的命令，它们并不是原始 dplyrR包的一部分。...csv 不执行dplyr命令，仅将输入数据作为CSV输出到stdout kable不执行dplyr命令，而仅将输入数据作为 knitr::kable()格式字符串输出到stdout 其工作原理：dplyr-cli...接着我们就通过一系列的实战例子来了解一下如何使用这个好用的工具，这里会使用到 mtcars.csv这个文件，当你从Github下载 dplyr-cli时，会包含其作为一个测试文件：例子一：简单的基本操作...实例四:连接两个文件作者提到该功能还不是很完善，主要的缺陷有：用于连接命令后的第一个参数必须是现有文件，并且格式为（CSV或RDS）不能通过 by连接指定参数，因此两个文件必须只有一个共同的列才能链接

2K1 0

R语言第二章数据处理④数据框排序和重命名目录

=================== 这一篇主要介绍如何通过一个或多个列（即变量）的值对数据中的行进行重新排序。...您将学习如何轻松地：使用R函数arrange（）[dplyr包]按升序（从低到高）进行排序使用arrange（）结合函数desc（）[dplyr package]以降序（从高到低）对行进行排序 library...函数arrange（）可用于通过一个或多个变量对行重新排序（或排序）。...dplyr :: rename（）重命名列将列Sepal.Length重命名为sepal_length，将Sepal.Width重命名为sepal_width： my_data %>% rename...( sepal_length = Sepal.Length, sepal_width = Sepal.Width ) 使用Rbase函数重命名列要将列Sepal.Length

1.5K5 0

UseGalaxy.cn生信云|零代码使用Tiverse优雅地处理数据集

Dplyr Join with one varibale 同上。区别在于只用一个变量连接两个表。...Dplyr Mutate create, modify, and delete columns mutate 函数用于添加新变量或修改现有变量，能够基于已有数据创建新的变量列，支持对数据框进行实时的变量操作和修改...Dplyr Rename columns rename 函数用于重命名数据框中的变量名，能够快速修改变量的名称，使得数据的列名更符合用户的需求和习惯。...Dplyr Select keep or drop columns select 函数用于选择数据框中的特定列，可以保留感兴趣的变量，并且能够根据列名、位置或条件表达式进行灵活的变量选择操作。...Dplyr Slice select rows by position slice 函数用于按行数进行切片，能够从数据框中提取特定的行，支持根据行数或行号选择需要的行，也支持使用负数表示从末尾开始计算的行数

1572 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭