开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何让分位数与summarise_at和group_by一起使用(dplyr)

在使用dplyr包进行数据处理时，可以通过summarise_at和group_by函数结合使用来计算分位数。

首先，需要加载dplyr包：

library(dplyr)

假设我们有一个数据框df，其中包含了需要进行分位数计算的变量x和需要进行分组的变量group：

df <- data.frame(x = c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10),
                 group = c("A", "A", "B", "B", "A", "A", "B", "B", "A", "A"))

现在，我们想要计算变量x的分位数，并按照group变量进行分组。可以使用以下代码实现：

result <- df %>%
  group_by(group) %>%
  summarise_at(vars(x), list(q25 = ~quantile(., 0.25),
                             q50 = ~quantile(., 0.5),
                             q75 = ~quantile(., 0.75)))

在上述代码中，group_by函数用于按照group变量进行分组，summarise_at函数用于对变量x进行汇总计算。vars(x)指定了需要进行计算的变量，list(q25 = ~quantile(., 0.25), q50 = ~quantile(., 0.5), q75 = ~quantile(., 0.75))指定了需要计算的分位数，并为每个分位数指定了一个别名。

最后，将结果存储在result变量中。result将是一个包含了分组变量和计算的分位数的数据框。

这是一个使用dplyr包中的summarise_at和group_by函数计算分位数的示例。在实际应用中，可以根据具体的数据和需求进行相应的调整和扩展。

腾讯云相关产品和产品介绍链接地址：

腾讯云计算服务：https://cloud.tencent.com/product/cvm
腾讯云数据库服务：https://cloud.tencent.com/product/cdb
腾讯云人工智能服务：https://cloud.tencent.com/product/ai
腾讯云物联网服务：https://cloud.tencent.com/product/iotexplorer
腾讯云移动开发服务：https://cloud.tencent.com/product/mobile
腾讯云存储服务：https://cloud.tencent.com/product/cos
腾讯云区块链服务：https://cloud.tencent.com/product/baas
腾讯云元宇宙服务：https://cloud.tencent.com/product/3d
腾讯云网络安全服务：https://cloud.tencent.com/product/ddos

相关搜索:R:将dplyr group_by与ggplot2一起使用，并按组更改标题 R和dplyr:如何将ifelse条件与外部数据帧一起使用如何与dplyr一起使用润滑剂的% in %？如何与和whereHas一起使用？如何使用dplyr和数据帧在R中创建百分位数？如何使用JavaScript让"dragAndDrop“与Selenium一起工作？如何在使用Dplyr::Group_by和Dplyr::Summarise时输出来自不同分组变量的摘要列表如何在和If语句中使用变量四分位数和四分位数间范围？如何将.names与dplyr交叉变异和匿名函数一起使用如何正确使用mutate_all和重新编码一起使用dplyr？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

dpois函数_frequency函数

https://r4ds.had.co.nz/transform.html#grouped-summaries-with-summarise

01

dplyr数据处理

filter()函数用于筛选出一个观测子集，第一个参数是数据库框的名称，第二个参数以及随后的参数是用来筛选数据框的表达式。

01

R语言包_dplyr_1

有5个基础的函数： - filter - select - arrange - mutate - summarise - group_by (plus)

02

tidyverse|数据分析常规操作-分组汇总（sumamrise+group_by)

汇总函数 summarise()，可以将数据框折叠成一行 ,多与group_by()结合使用

06

分组统计你只想到group_by操作吗？

最近在研究excel透视图，想到好像自己在R-分组操作并不是很流畅，顺便学习分享一下。R自带数据集比较多，今天就选择一个我想对了解的mtcars数据集带大家学习一下R语言中的分组计算（操作）。

03

R语言分组计算，不止group_by

最近在研究excel透视图，想到好像自己在R-分组操作并不是很流畅，顺便学习分享一下。R自带数据集比较多，今天就选择一个我想对了解的mtcars数据集带大家学习一下R语言中的分组计算（操作）。

05

R语言包_dplyr_2

data_frame() is a better way than data.frame() for creating data frames. Benefits of data_frame():

04

35. R 数据整理（七：使用tidyr和dplyr处理数据框 2.0）

假设数据以 tibble 格式保存。数据集如果用于统计与绘图，需要满足一定的格式要求，(Wickham, 2014) 称之为整洁数据 (tidy data)，基本要求是每行一个观测，每列一个变量，每个单元格恰好有一个数据值。这些变量应该是真正的属性，而不是同一属性在不同年、月等时间的值分别放到单独的列。

03

数据处理|R-dplyr

arrange函数按给定的列名进行排序，默认为升序排列，也可以对列名加desc()进行降序排序。

01

R语言之数值型描述分析

在分析之前，先将数据集 birthwt 中的分类变量 low、race、smoke、ht 和 ui 转换成因子。

02

R tips：使用!!来增加dplyr的可操作性

dplyr包在数据变换方面非常的好用，它有很多易用性的体现：比如书写数据内的变量名时不需要引号包裹，也不需要绝对引用，而这在多数baseR函数中都不是这样的，比如：

03

生信学习小组day6--大姚

上述一串代码意思是新增一列列名为“new”、数值是Sepal.Length * Sepal.Width的列

00

R tips：dplyr编程

dplyr的函数由于使用tidy evaluation（R中的一种非标准执行（NSE）实现方式）的方法，可以使得其具有更好的易用性：变量不需要绝对引用和引号包裹。

03

「R」dplyr 列式计算

同时对数据框的多列执行相同的函数操作经常有用，但是通过拷贝和粘贴的方式进行的话既枯燥就容易产生错误。

01

Day6-学习笔记（2024年2月3日）

R包是多个函数的集合，具有详细的说明和示例，学习生信R语言必学的原因是丰富的图表和biocductor的各种生信分析R包，包的使用是一通百通的，以dplyr为例，讲解一下R包

01

R语言之 dplyr 包

这个包以一种统一的规范更高效地处理数据框。dplyr 包里处理数据框的所有函数的第一个参数都是数据框名。

02

「R」curly curly，更好的非标准计算

rlang v0.4.0引入了新的非标准计算操作符 {{。这大大方便了dplyr重编程。

01

Day6 呦呦鹿鸣—学习R包

列表书写顺序决定了最终合成列表中列的顺序,每列数值的类型必须相同；以"by"的列为标准，补齐列表，空值为"NA"

01

Day6：学习R包

01

Day-6 香波🐟

6.简单合并:在相当于base包里的cbind()函数和rbind()函数;注意，bind_rows()函数需要两个表格列数相同，而bind_cols()函数则需要两个数据框有相同的行数

01

R语言基于dplyr实现数据快捷操作

4. filter 匹配对应行的数据。并生成结果。等同于subset函数。实例：

04

Day4——查布铎徳勒

05

R海拾遗_再谈非标准评估

上面的例子summary的变量是disp，分组变量是cyl和am，使用三个点这里传递了任意个参数

02

懒癌必备-dplyr和data.table让你的数据分析事半功倍

本文介绍了如何使用dplyr和data.table两个R包进行数据清洗、数据加工和数据分析，通过几个实际案例展示了dplyr和data.table的常用功能和高效操作。

07

Day6-橙子

01

从头学R语言——DAY 3

R包直接在Rstudio页面下载的3大来源：官网CRAN、Biocductor、github

01

常用R包-dplyr

dplyr是一个在R语言中非常流行的数据处理包，它提供了许多功能强大且易于使用的函数，包括 select、 filter、mutate、arrange和summarize 等。这些功能使得dplyr成为数据清洗、处理和分析的首选包。

01

生信技能树七天学习小组 Day6笔记——学习R包

install.packages()/BiocManager::install()

01

学习R包

options("repos"=c(CRAN="http://mirrors.tuna.tsinghua.edu.cn/CRAN/"))

01

「R」dplyr 行式计算

通常 dplyr 和 R 更适合对列进行操作，而对行操作则显得更麻烦。这篇文章，我们将学习围绕rowwise() 创建的 row-wise 数据框的 dplyr 操作方法。

02

生信星球Day4 学习R包

方法一：手动设置，Tools→Packages→Primary CRAN repository

04

「R」绘制分组排序点图

我在看过的一些 Nature 文章和 COSMIC 数据库中看到用点图来展示不同癌症类型下 TMB 的分布差异。在 R 包中，我有看到过 maftools 中可以绘制这样的图，用来表示新的数据队列与 TCGA 数据的比较，这也是应用于 TMB 分析。因为研究问题，我最近也想尝试使用改种图形来展示数据。而且，该图可以拓展到任意可以适应的场景下，所以我想基于 ggplot2 来创建一个通用的绘图函数。

03

R语言ggplot2画带有置信区间的折线图和分组求均值遇到的一个问题

今天遇到一个分组求均值的问题，愣是看不出问题出在哪了，大家帮我看看文末的代码是哪里出问题了，或者留言说一下自己分组求均值在R语言里是如何实现的。

01

R||R语言基础（三）_R包

部分人可能会因为镜像的问题失败，解决方法https://mp.weixin.qq.com/s/XvKb5FjAGM6gYsxTw3tcWw

05

DAY6-学习R包

03

Day6_鸭鸭

options("repos"=c(CRAN="http://mirrors.tuna.tsinghua.edu.cn/CRAN/"))

01

R数据科学-1（dplyr）

如今数据分析如火如荼，R与Python大行其道。你还在用Excel整理数据么，你还在用spss整理数据么。

02

DAY6-学习R包

03

第6天生信学习笔记-微信公众号生信星球

R包是多个函数的集合，R语言必学的原因是丰富的图表和Biocductor上面的各种生信分析R包。

01

R数据科学|5.5.2内容介绍及课后习题解答

要想对两个分类变量间的相关变动进行可视化表示，需要计算出每个变量组合中的观测数量。常用的两种方法有：

03

R语言安装R包DAY6-Gaozsi

一个新数据框，其中包含键、 x 值和 y 值。我们使用 by 参数告诉 dplyr 哪个变量是键：

01

学习小组Day6-bubble

还有一种像Linux一样直接修改R中的相当于Linux中的.bashrc/环境文件一样的R的环境文件.Rprofile即可

05

dplyr-cli：在Linux Terminal上直接执行dplyr

熟悉R的朋友都会知道， dplyr包是对原始的数据集进行清洗、整理以及变换的有力武器之一。但是其使用会局限于你需要有打开R/R studio或者通过R脚本来执行 dplyr。对于这个问题，今天即将需要介绍的 dplyr-cli就能很好的解决这个问题。

01

如果伦敦地铁图是数据科学家画的……

伦敦的地铁路线图图可谓是地铁路线图的鼻祖。多年来，它形成的配色与排版方案，造就了它独特的外观和风格，但最令人惊叹的，还是其神来之笔的设计思路。

03

DAY06-R包学习

01

生信学习小组

R包安装命令是install.packages(“包”)#安装的包存在于CRAN网站

02

R语言数据处理：飞机航行距离与到达延误时间有什么关系??

数据分析有一半以上的时间会花在对原始数据的整理及变换上，包括选取特定的分析变量、汇总并筛选满足条件的数据、排序、加工处理原始变量并生成新的变量、以及分组汇总数据等等。这一点，我想大部分使用EXCEL的童鞋都深有体会，写论文时，这么多的数据进行处理，手动汇总、筛选、变换，工作量实在是太大。而本文介绍的dplyr包简直就是Hadley Wickham （ggplot2包的作者，被称作“一个改变R的人”）大神为我们提供的“数据再加工”神器啊。本文试图通过一个案例，对神奇的dplyr包的一些常用功能做简要介绍

04

``` 学习小组生信笔记——DAY6

06

Day4-R包学习

将 CRAN 镜像地址设置为了清华大学的镜像站点。这样，在使用 R 语言安装或更新包时，系统会优先从清华大学的镜像站点下载，从而加快下载速度

01

Day6-蓝色柠檬

今天的任务是学习R包。以dplyr包的安装加载和使用为例进行学习，因为R包之间的使用是相通的，掌握了一个，后面的可以通过具体代码的学习进行使用。dplyr这个包我以前没有接触过，从这个入手，又能学习到新东西真不错。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭