开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

dplyr 0.7 -将分组变量指定为字符串

dplyr是一个R语言中用于数据处理和数据操作的包，它提供了一套简洁且一致的语法，使得数据的筛选、排序、分组、汇总等操作变得更加方便和高效。

在dplyr 0.7版本中，可以通过使用字符串来指定分组变量。这意味着可以直接使用变量名的字符串形式来进行分组操作，而不需要提前将变量转换为符号或使用其他方式来指定分组变量。

这种功能的引入使得在使用dplyr进行数据操作时更加灵活和便捷。通过将分组变量指定为字符串，可以更方便地进行动态的分组操作，特别是在需要根据用户输入或其他条件来确定分组变量时，这种功能尤为有用。

使用字符串指定分组变量的示例代码如下：

library(dplyr)

# 创建一个示例数据框
df <- data.frame(
  group = c("A", "B", "A", "B"),
  value = c(1, 2, 3, 4)
)

# 使用字符串指定分组变量
group_var <- "group"
result <- df %>%
  group_by(!!sym(group_var)) %>%
  summarise(total = sum(value))

# 输出结果
print(result)

在上述代码中，我们首先创建了一个示例数据框df，其中包含了一个分组变量group和一个数值变量value。然后，我们使用字符串group_var来指定分组变量，并在group_by()函数中使用!!sym()来将字符串转换为符号，以实现分组操作。最后，我们使用summarise()函数对每个分组计算了value的总和，并将结果存储在result中。

dplyr的这个功能在许多数据处理和分析的场景中都非常有用。它可以帮助用户更灵活地进行数据操作，并且可以与其他dplyr的函数和操作符结合使用，实现更复杂的数据处理任务。

腾讯云提供了一系列与云计算相关的产品和服务，其中包括云服务器、云数据库、云存储等。您可以通过访问腾讯云官方网站（https://cloud.tencent.com/）了解更多关于腾讯云的信息和产品介绍。

相关搜索:R: ddply -通过将字符串指定为变量名来聚合数据使用dplyr::summarise()将字符串向量用作函数中的变量如何将一个分组变量分成两个R中有字符串值的变量？如何将也满足R中另一个标准的分类变量分组？DPLYR？如何将值列表作为字符串运行函数后，将其指定为变量名如何将表示表达式的字符串传递给dplyr 0.7动词？将变量作为字符串传递给dplyr 将唯一id分配给dplyr中分组变量中的连续行将字符串变量传递给dplyr中的扩展函数腾讯云pstn通信平台

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

来增加dplyr的可操作性

的这种易用性是有代价的，假如想要对分析工作稍微增加一些编程属性时，就会发现dplyr的异常情况，比如将分组变量赋值给一个变量，使用变量来进行分组： ### 分组变量group_var无法完成工作 group_var...辅助dplyr完成编程工作上面的例子中，之所以group_var不起作用，是因为dplyr直接将group_var当做变量名，然后去mtcars中寻找名字叫做group_var的列，这肯定是会报错的。...sym是指的将group_var变为Symbol，这是由于上面code的所有操作层面都是上面提到的R代码运行阶段中的语句阶段，对于变量而言，其需要变为Symbol才可以操作。...mean_mpg # # 1 1 20.8 # 2 2 18.7 # 3 4 21 上述过程的实现过程是，首先map逐一将分组变量...PS：对于ggplot2而言也是一样的，它的aes也是不能直接使用变量传入列名，如果想要使用赋值了字符串的变量来传值的话，可以如上述操作。但是也有更简单的的办法，它是？

2.3K3 1

R︱高效数据操作——data.table包（实战心得、dplyr对比、key灵活用法、数据合并）

（2）多变量筛选，用&|等 from_dplyr = filter(tb,State=='CA' & Claim.Type!...="Hospice"] （3）还有一些复杂结构： dt[a=='B' & c2>3, b:=100] #其他结构在dt数据集中，筛选a变量等于"B"，c2变量大于3，同时将添加b变量，数值等于...DT数据集按照x分组，然后计算v变量的和、最小值、最大值。（2）dplyr函数利用%>%（链式操作）来改进：链式操作是啥意思呢？...在dplyr分组求和的过程中，还是挺有用的。...first"] V1 V2 V3 V4 1: 1 A -1.1727 1 2、nomatch参数——未匹配样本处理 nomatch参数用于控制，当在i中没有到匹配数据的返回结果，默认为NA，也能设定为

7.6K4 3

R数据科学-1（dplyr）

忘记保存，白费时间效率低，时间长现在，我们将学习对处理数据有用的两个软件包： dplyr是用于简化表格数据操作的软件包。 tidyr使您可以在不同的数据格式之间快速转换。...%>%管道函数，其实就是将f（）写在了数据的后面，下面示例的两个操作，都得到df，效果一样。只不过 %>%看起来更简单，将mtcars赋予新的tibble。...new=mpg*cyl) df %>% dplyr::filter(am==1) df %>% dplyr::filter(am==1 & gear==4) 5.数据分组计算有时候，需要分组计算均值标准差...或者根据am及gear分组计算mpg均值标注差。...，譬如字符串，因子及数值类型相互转换，上述数据里面dbl 意思是数值类型（double class）我们现在产生新的字符串chr及因子fct。

1.6K2 0

🤩 ggstatsplot | 一个满足你日常统计需求的高颜值R包（四）

写在前面点图用处非常广泛，可以展示变量的分布情况，变量之间的相关性，回归结果等本期介绍的是ggstatsplot包中绘制dotplot,scatterplot相关函数 2....示例数据 dat <- mpg 图片 4. dotplot展示样本分布 4.1 初步绘制用到的函数是ggscatterstats 由于因子太多，我们在这里用filter函数过滤一下 df <- dplyr...), title = "Distribution of mileage of cars", #ggtheme = ggplot2::theme_dark() ) 图片 --- 4.2 复杂分组绘制...label.expression = displ > 5 & hwy> 24, ## which points to label point.label.args = list(alpha = 0.7..."#009E73", ## fill for marginals on the y-axis title = "aaa", caption = "Source" ) 图片 --- 5.2 复杂分组绘制

3942 0

🤩 ggstatsplot | 一个满足你日常统计需求的高颜值R包（四）

写在前面点图用处非常广泛，可以展示变量的分布情况，变量之间的相关性，回归结果等本期介绍的是ggstatsplot包中绘制dotplot,scatterplot相关函数 2....示例数据 dat <- mpg 4. dotplot展示样本分布 4.1 初步绘制用到的函数是ggscatterstats 由于因子太多，我们在这里用filter函数过滤一下 df <- dplyr...), title = "Distribution of mileage of cars", #ggtheme = ggplot2::theme_dark() ) ---- 4.2 复杂分组绘制...label.expression = displ > 5 & hwy> 24, ## which points to label point.label.args = list(alpha = 0.7..."#009E73", ## fill for marginals on the y-axis title = "aaa", caption = "Source" ) ---- 5.2 复杂分组绘制

4401 0

R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)

2、cut()函数 cut(x, n)：将连续型变量x分割为有着n个水平的因子 cut(x, breaks, labels = NULL, include.lowest = FALSE, right...## #dplyr中基本函数 select——子集选取（筛选变量，列） select(Hdma_dat,pclass,survived) ##选择pclass变量 ?...二、数据分组以及分组汇总 1、cut函数 b<- cut(a, 5,labels=F) #将数据平均分成5组，rank=5代表大，rank=1代表小 2、aggregate函数——分组汇总 ?...在base包里和split功能接近的函数有cut(对属性数据分划)，strsplit(对字符串分划)以及subset（对向量，矩阵或数据框按给定条件取子集）等。...subset=which+数据集操作 which=order+多变量运行。

20.5K3 2

广义估计方程和混合线性模型在R和python中的实现

同时，它指与因变量有线性相关并在探讨自变量与因变量关系时通过统计技术加以控制的变量。常用的协变量包括因变量的前测分数、人口统计学指标以及与因变量明显不同的个人特征等。协变量应该属于控制变量的一种。..., "normo")))head(dataset)patient: 患者ID编号；visit：化验次序编号time：化验时间（单位年），第一次化验定为0，后面依次推延；GFR：肾小球滤过率，单位是ml/...预测变量还需要加上一个时间x尿蛋白的交互项（交互项是指不同的尿蛋白等级会有不同的GFR下降斜率和下降曲线）数据特点summary(dataset) dataset %>% group_by(patient...通过协变量patient考虑到他们内部观测值的相关性后再对总体效应进行推断，如何确定分组需要考虑到组群变量。...固定效应是具有特定水平的变量，而随机效应捕捉了由于分组或聚类引起的变异性。比如下方正在探究尿蛋白对来自不同患者的GFR的影响。拥有的变量（例如年龄、性别、尿蛋白等）和患者的变量（patient）。

1360 0

R语言ggplot2画图比较两组连续型数据的几种方案

连续型数据的的分组比较在科研生活中非常常见，比如：实验组和对照组基因表达量的比较、临床病人存活组和死亡组某项检查指标的比较等等。检验两组连续型数据之间是否存在差异通常会使用T检验。...以下代码用到3个R语言包分别是ggplot2 用来画图RColorBrewer 用来生成颜色dplyr 用来整理数据 ggplot2和dplyr如果是第一次使用需要安装，安装用到的命令是 install.packages...(data2)[1]<-"CRP" colnames(data2)[2]<-"Status" data<-rbind(data1, data2) View(data) 得到的数据集data是包含两个变量...image.png 画图 library(ggplot2) ggplot(df3, aes(Status,`mean(CRP)`))+ geom_col(aes(fill=Status),width=0.7...分组信息在x轴已经体现，故去除图例，避免累赘。出图如下： ?

4.4K2 0

单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析12

图片代码解析scRNA-seq processing workflow在处理完每个患者肿瘤样本后，我们运行以下脚本，将患者 1-5 的 Seurat 对象组合成一个代表患者 1-5 的 EEC 队列的多样本...organ == "Vasculature" | organ == "Smooth muscle")##as.character函数将日期向量...vector数据转化为字符串(character)panglaodb % dplyr::count(SingleR) ##rep：R中生成重复序列的函数repcluster.ids <- rep("fill",length...########################################################################总结这部分也是比较经典的试验，为了探究EEC的发病机制，将1

6081 0

单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析4

correalted with read depth, check to see if biological variation is corralted to PC1#首先确定亚群分析的resolution确定，将resolution...确定为0.7#round：它四舍五入到给定的位数，如果没有提供四舍五入的位数，它会将数字四舍五入到最接近的整数if (round(abs(count_cor_PC1),2) > 0.5){ if(...，包括最大值、最小是、均值、方差、极差等 library(psych) test <- VlnPlot(rna,features = "immune.2") #describeBy：分组计算...,"-",cnvs) regions <- regions[regions$cnv_name %in% cnvs, ] #sub R语言中的函数用于替换字符串中模式的第一个匹配项...进行判断不同的数据属性 if (wilcox$p.value < 0.05){ rna <- rna library(stringr) #str_remove：删除字符串中的匹配模式

5322 0

数据处理|R-dplyr

dplyr包实现数据的清洗处理，包括数据整合、关联、排序、筛选、汇总、分组等。...arrange(iris,Sepal.Length) # 将数据按照Sepal.Length升序排序 5）变量变换/重构 mulate()函数可以数据拓展，也可以在保留原变量的基础上增加变量，进行数据处理...Width) #计算一个或多个新列并删除原列 6）数据汇总 summarize()函数实现数据集聚合操作，将多个值汇总成一个值 summarise(iris,avg = mean(Sepal.Length...7）数据分组 group_by函数对数据进行分组后，结合summarize函数，可以对分组数据进行汇总统计。...Q：按品种分组，分别计算花萼宽度的均方差 summarise(group_by(iris,Species),sd=sd(Petal.Width)) 8）连接操作符 dplyr包里还新引进了一个操作符,%

1.9K1 0

单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析9

organ == "Vasculature" | organ == "Smooth muscle")# split()函数是对字符串进行分割成列表...SingleR % dplyr::count(SingleR) ## rep函数可以让不同的元素重复多次cluster.ids % dplyr::filter(RNA_snn_res.0.7 ==i) %>% arrange(desc(n))

4182 0

R语言数据处理：飞机航行距离与到达延误时间有什么关系??

数据分析有一半以上的时间会花在对原始数据的整理及变换上，包括选取特定的分析变量、汇总并筛选满足条件的数据、排序、加工处理原始变量并生成新的变量、以及分组汇总数据等等。...带着这个问题，我们将首先使用dplyr包对给出的航班数据进行处理。...1.dplyr包的安装加载与示例数据准备 1.1 安装dplyr包脚本输入代码： install.packages("dplyr") #加载dplyr包 library(dplyr) 1.2安装 nycflights13...在这个环节，主要历经三个过程：数据分组（Split）：可以指定目标变量，将数据进行分组。...3.1 数据分组 dplyr包里的分组是由group_by()函数实现的，脚本输入代码： by_dest <- group_by(myFlights, destination) class(by_dest

3K4 0

从一件数据清洗的小事说起

村长，数据科学、指弹吉他及录音工程爱好者，浙大金融学博士在读，在data.table包和MongoDB的使用上有较多经验。...这是一个类json格式嵌套的数据，其中存在两个变量，第一个变量是cusnum作为序号，第二个是一个类json的嵌套变量，里面以类jsno格式嵌套了很多变量。需要将这个数据集转换成如下格式： ?...其实这一期这么扯淡的讲这么多事情，只是为了说明一点，data.table真的有很好的性能，尤其在处理海量数据方面（在分组特别多的时候，相比dplyr和pandas有2x~10x的提升，来自官方文档）。...data.table之所以比dplyr要快，在于两者设计的哲学不同。dplyr的哲学和Linux类似：每个组件就做好一件事，当把所有组件拼在一起之后就是一个全功能的包了。这个理论利弊共存。...相较之下，data.table则通过把数据处理中最常见的“选取行”、“修改列”、“分组”三大操作通过dt[i,j,by]的语法统一了一起来。

6711 0

《高效R语言编程》6--高效数据木匠

通常的数据清理是将非标准文本字符串转换成lubridate简介所描述的数据格式。vignette("lubridate") ? 整洁是个广泛的概念，也包括重构数据，以便有利于数据分析和建模。...tidyr方便了收集与分割两个常见的操作 gather()收集是将列名换成新变量，将宽表变成长表，spread()是实现相反过程的函数。...用法是：gather(data,key,value，-religion),分别是数据框，要转换成分类的列名,单元值的列名和清除收集的变量使用seperate()分割联合变量分割是指将一个实际由两个变量组成的变量分割成两个独立列...使用变量名非标准化求值更高效，见R语言 dplyr传递参数_自由平等~忠诚奉献-CSDN博客[2]。只是函数名多了个下划线那么简单吗？...unlist()函数的作用，就是将list结构的数据，变成非list的数据，即将list数据变成字符串向量或者数字向量的形式。

1.9K2 0

dplyr数据处理

另外，当想要把几个需要的列移到前面，可以配合使用 everythins()函数，将剩余的列添加到后面。...mtcars %>% dplyr::sample_n(10) mtcars %>% dplyr::sample_frac(0.2) 六、创建新变量有时需要对已有变量进行重新计算，例如计算几列的和...，会某一列取对数，这样将生成新的变量，这个时候可以使用 mutate 函数。...使用 summarise()可以对每一列单独进行计算，例如求和，求平均值等，这些都可以使用apply 系列函数来完成，summarise()一般都配合 group_by()函数一起使用，可以进行分组统计...分组统计：group_by()函数与 summarise()配合一起使用，可以进行分组统计。

1.5K1 0

R语言学习笔记之——数据处理神器data.table

data.table 1、I/O性能： data.table的被推崇的重要原因就是他的IO吞吐性能在R语言诸多包中首屈一指，这里以一个1.6G多的2015年纽约自行车出行数据集为例来检验其性能到底如何，...rm(list=ls()) gc() 2、索引切片聚合 data.table中提供了将行索引、列切片、分组功能于一体的数据处理模型。...(carrier,tailnum)] #但心里要清楚列索引接受的条件是含有列表的列表，而且这里的列表作为变量给出，而非data.frame时代的字符串向量。行列同时索引毫无压力。...注意以上新建列时，如果只有一列，列名比较自由，写成字符串或者变量都可以，但是新建多列，必须严格按照左侧列名为字符串向量，右侧为列表的模式，当然你也可以使用第二种写法。...多分组聚合。 mydata[,.(sum(dep_delay),mean(arr_delay)),by = .(carrier,origin)] ? 多分组计数。 mydata[,.N,by = .

3.6K8 0

R可视化：不一样的ggplot2箱线图

x: 箱线图的 x 轴变量，通常是分组的因子。y: 箱线图的 y 轴变量，表示要展示的数值数据。group: 分组变量，用于区分不同的箱线图。...Sepal.Length在每个分组的出现率和对应画图位置坐标plotdata dplyr::select(Sepal.Length, Species) |> dplyr::mutate...::group_by(Group) |> dplyr::summarise(occ = occ_fun(Index)) |> dplyr::mutate(occ_lab = paste0(occ *...ggplot(data = plotdata, aes(x = Group, y = Index, color = Group))：初始化一个 ggplot 对象，使用 plotdata 数据框，并设置分组变量...labs(x = "")：设置 x 轴的标签为空字符串。

540 0

🤩 superheat | 超级简单的热图绘制解决方案！~（二）（聚类和注释图的添加~）

superheat(mtcars, scale = T, n.clusters.rows = 3) ---- 4.3 强制显示行名默认情况下，在聚类时，相应的标签会分组到聚类名称中...如果想强制标签为原始变量名称，可以分别指定left.label = 'variable'或Bottom.label = 'variable'。...yr.axis.name = "miles per gallon") ---- 5.2 调整大小 superheat(dplyr::select(mtcars, -mpg),...superheat(dplyr::select(mtcars, -mpg, -gear), # scale scale = T, # 行聚类...with mpg", yt.axis.size = 14, yt.axis.name.size = 14, yt.plot.size = 0.7

2043 0

R海拾遗_再谈非标准评估

来进行评估，因为之前将cyl引用，这使用！！打开 library("dplyr") by_cyl % group_by(!!...（描述的变量）的情况使用enquo进行引用使用as_label转换分组变量为字符串 使用paste0粘贴前缀使用！！...) # 使用as_label将变量名转换为字符 summary_nm <- as_label(summary_var) summary_nm <- paste0("avg_", summary_nm...6 0 205. #> 4 6 1 155 #> 5 8 0 358. #> # … with 1 more row 多参数（分组变量...，都是使用分组变量，那么对于多描述变量？

6702 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭