开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何在dplyr的group_by上使用if/ifelse

在dplyr的group_by中使用if/ifelse，可以通过mutate()函数来实现条件分组的操作。

首先，需要加载dplyr包并创建一个数据框（data frame）。接下来，使用group_by()函数对数据框按照指定的列进行分组。然后，使用mutate()函数创建一个新的列，并使用ifelse()函数在每个分组中进行条件判断。

例如，假设我们有一个名为data的数据框，其中包含两列：group和value。我们想要对group列进行分组，然后在每个分组中根据条件对value列进行判断和修改。以下是实现的代码示例：

library(dplyr)

# 创建数据框
data <- data.frame(
  group = c("A", "A", "B", "B", "C", "C"),
  value = c(10, 20, 30, 40, 50, 60)
)

# 使用group_by和mutate进行条件分组
result <- data %>%
  group_by(group) %>%
  mutate(new_value = ifelse(value > 30, "High", "Low"))

# 打印结果
print(result)

在这个例子中，我们按照group列进行分组，并根据value列的值判断新的列new_value的取值。如果value大于30，则new_value为"High"，否则为"Low"。

以上就是使用dplyr的group_by进行条件分组的方法。关于dplyr的更多用法和示例，可以参考腾讯云的产品文档： dplyr使用教程

相关搜索:在dplyr中的group_by之后在汇总中使用ifelse 在使用ifelse语句的dplyr中，是否有类似于group_by领先/滞后的pandas/numpy函数？使用group_by()类似于dplyr中的filter()？如何使用列名的向量作为dplyr::group_by()的输入？如何在使用Dplyr::Group_by和Dplyr::Summarise时输出来自不同分组变量的摘要列表使用Dplyr的"group_by“创建组，然后使用Stringr查找组之间的差异使用dplyr中的group_by函数操作data.frame对象集 dplyr:在原始数据帧中使用聚合的group_by结果如何使用group_by函数在dplyr中应用预先设计的函数在R中使用dplyr和group_by得不到预期的结果使用dplyr:: mutate ()和ifelse()基于R中排名顺序的条件突变语句使用ifelse和dplyr维护POSIXct时间格式，并返回true和false的POSIXct 如何在单行数据集上使用spread和group_by 使用$%in%$的dplyr滤镜在点上使用滤镜如何在R中的map函数中使用ifelse 如何在R中的函数中使用group_by 使用R和dplyr计算响应的持续时间？group_by的一些问题使用dplyr中的group_by函数，有没有办法对单个变量的范围进行分组？如何在Dialogflow messenger上使用丰富的响应消息，如建议芯片？如何在data.table的j中正确使用ifelse()？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

R语言之 dplyr 包

select(birthwt, bwt, age, race, smoke) 请注意，MASS 包里有一个同名函数 select( )，如果同时加载了 dplyr 包和 MASS 包，R 会默认使用较后加载的包里的函数...为了避免混淆，我们可以使用符号 :: 特别指明使用某一个包里的函数，例如 dplyr::select( )。之后我们将会对函数 select( ) 作进一步介绍。...使用 group_by( ) 拆分数据框函数 group_by( ) 可以将数据框按照某一个或某几个分类变量拆分成多个数据框。...因此，上面的输出结果看上去和原来的数据框没有什么差别，但实质上是不同的。最本质的差别是多了一个分组属性（Groups），即上面的结果包含了 3 个数据框，分别对应于变量 race 的 3 个类别。...as_tibble(birthwt) 下面我们将会看到，把函数 group_by( ) 和 summarise( ) 联合使用能方便地对变量进行分组统计。 7.

4282 0

「R」绘制分组排序点图

使用如果读者仅仅想使用，请从 Gitee 上安装 sigminer 包，或者拷贝本文最后的函数： remotes::install_git("https://gitee.com/ShixiangWang...使用 ggplot2 实现这个图我遇到了不少难点，在实现的过程中除了深入理解了 ggplot2，我也同时感受到了它的灵活和限制。...::mutate(.order = dplyr::row_number()) %>% dplyr::group_by(.data$.gvar) %>% dplyr::arrange(.data...d %>% dplyr::group_by(.data$.gvar) %>% dplyr::summarise( x_m = median(.data$x, na.rm =...::group_by(.data$.gvar) %>% dplyr::summarise( n = dplyr::n(), xmin = min(.data$x, na.rm

1.7K3 0

R数据科学-1（dplyr）

R数据科学（dplyr）如今数据分析如火如荼，R与Python大行其道。你还在用Excel整理数据么，你还在用spss整理数据么。...两个软件包中的命令都可以与管道函数（％>％）很好地配合使用，这可以使代码更具可读性。详细内容可参考Cheatsheet手册。...，或者看gear不同水平下的最大值最小值，那么就用到group_by()与 summarise() 函数。...这时候就需要用到ifelse函数（转换成二分类变量），或者cut函数转换成多类别变量。...代码如下 df = mtcars %>% as.tbl() %>% dplyr::select(mpg,cyl,am,gear) %>% mutate(mpg1=ifelse(mpg<25,

1.6K2 0

课前准备---空间转录组数据分析之分子niche

去年（2023年）刚开始上单细胞的时候，就是不设置任何限制，公开分享，结果是什么呢？遭受一些医生的诋毁，网暴，各种举报，等等等等。...就像董宇辉说的，怎么可能有人完全理解你的苦，然后因此懂得你的难呢？不会有的。...(cell_type) %>% nest() %>% mutate(wres = map(data, run_wilcox_up)) %>% dplyr::select(wres) %>% unnest...ungroup() %>% mutate(p_corr = p.adjust(p.value))wilcoxon_res % mutate(significant = ifelse...Finally describe the proportions of those niches in all the datacluster_counts % dplyr

1242 0

GMSB文章九：微生物的相关关系组间波动

以下是 secom_linear 函数的主要参数和它们的作用：data: 包含微生物组数据的列表。assay_name: 指定数据集中的哪个检测类型（如“counts”）。...tax_level: 指定使用的分类水平，例如“Phylum”（门）。pseudo: 伪计数，用于稳定稀疏矩阵的计算。prv_cut: 用于过滤掉低丰度的物种的阈值。...::group_by(pair) %>% dplyr::summarise(empty_idx = ifelse(all(value == 0), TRUE, FALSE))non_empty_pair...以下是 secom_linear 函数的主要参数和它们的作用：data: 包含微生物组数据的列表。assay_name: 指定数据集中的哪个检测类型（如“counts”）。...::group_by(pair) %>% dplyr::summarise(empty_idx = ifelse(all(value == 0), TRUE, FALSE))non_empty_pair

901 0

R可视化之美化功能富集条形图

分享是一种态度基因集富集分析是很常见的分析内容，可视化展示的方式也多样。本文提供两组分组间的差异表达基因集的功能富集结果的一些相对美观的可视化方式。...::mutate(group_type = factor(ifelse(group == 1, sample_names[1], sample_names[2]), levels = sample_names...)) %>% dplyr::mutate(Gene_Number = Count * group) # 为便于图形展示，提取部分子集 dat % dplyr::group_by...(group_type) %>% dplyr::do(head(., n = 5)) 4 可视化KEGG富集分析结果 library(ggplot2) library(cowplot) ## 设置统一的主题...::group_by(group_type) %>% dplyr::arrange(Gene_Number) ggbarplot(dat2, x = "Description", y = "Gene_Number

2.2K3 0

单细胞免疫组库VDJ|和Nature学STARTRAC，定量T细胞动态变化

上图中不同颜色的圆球代表不同的T细胞类型，圆球上不同颜色的“Y”代表了不同的TCR克隆型，右边给出了简单的算法。...一准备R包，数据首先github上加载R包和示例数据，然后将我们自己的数据整理成示例数据的格式，然后运行Startrac的话只需要一行代码即可。...:group_by(Cell_name) %>% dplyr::summarise(reads=max(reads), umis=max(umis)) head(test) vdj_a <- data.frame...) test % group_by(Cell_name) %>% dplyr::summarise(reads = max(reads), umis=max(umis) )...后面会分享一下发表在2021年Science 的Pan-cancer single-cell landscape of tumor-infiltrating T cells文章中使用Startrac的相关指数与

2.5K4 0

GMSB文章七：微生物整合分析

它是一种扩展了单变量方差分析（ANOVA）的技术，允许研究者检验多个响应变量是否受到一个或多个分类自变量的影响。多维数据：MANOVA处理的是多维数据集，即每个观测值都有多个响应变量的测量值。...::filter(grepl("Species:", species)|grepl("Genus:", species)) %>% dplyr::mutate(species = ifelse(grepl...a |t|)"] b % dplyr::group_by(tax) %>% dplyr:...%>% dplyr::group_by(tax) %>% dplyr::summarise(y = ifelse(mean(y, na.rm = TRUE) > 0,

931 0

R代码|dplyr包的使用示例

代码代码来自《r-data-science-quick-reference-master》的内容。 dplyr包的使用例子。...df %>% mutate(abs(x)) ## ------------------------------------------------------------------------ ifelse_abs...<- function(x) ifelse(x < 0, -x, x) df %>% mutate(ifelse_abs(x)) ## ------------------------------...mean_income ) ) %>% spread(key = "year", value = "mean_income") 温馨提示：第一步：运行一边代码，掌握相应的包和函数使用...第二步：迁移到自己的数据集，进行应用

1.6K3 0

R语言宏基因组学统计分析(第四章)笔记

原来图的函数用错了，是boxplot ? 可以使用ggplot2画更高品质的图。...）；2、另一个原因是让函数不试图去修正种的名字，来保证系统上的正确（否则，名字中的空间可能变为.）。...read.csv()是读我们通常使用的“，”分隔，“.”分小数的文件。...，升序，可以认为x[order(x)]=sort(x) ifelse()R语言是向量化的，ifelse()可以遍历所有因子并避免使用循环，根据前面我们知道，循环调用函数次数超级多的话会让时间明显变长。...group <- ifelse(iris$Petal.Length < 4,1,2)高级一些的话，ifelse()还可以嵌套使用。

1.8K2 0

多种方法在火山图上标记感兴趣基因（差异基因，或者通路）

健明全国巡讲课程结束后的一个月持续答疑环节，被问的最多的问题居然是如何在差异分析后的火山图上面标记出来感兴趣的基因，这里有必要派我们杰出能干的小洁老师出马！...require(dplyr))install.packages("dplyr") library(ggplot2) library(ggrepel) library(dplyr) 代码来源下面代码来源于...0.6875469 Stable #6 C8B 7.88047e-04 1.2374303 Stable data$change = ifelse...(data$p.value = 1, ifelse(log2(data$FC)> 1...方法二：看R数据科学代码来源以下代码出自R数据科学笔记第21章，原书第312页： best_in_class % group_by(class) %>% filter(row_number

17.6K3 4

如何在 Mac 上愉快的使用 Docker

一、目标任务首先要明确的是, 作为了一个每天在 Linux Server 上 rm -rf 的人来说, 如果想在 Mac 上使用 Docker, 最舒服的也是兼容所有 docker cli 命令行操作即可...; 至于图形化的界面完全不需要, 我们并不指望图形化界面能比敲命令快到哪里去, 也不指望图形化界面变为主力; 所以本篇文章的核心目标:在 Mac 上使用完整的 docker cli 命令, 包括对基本的...Lima 方案直接看第五节.三、虚拟机方案目前在 M1 上, 唯一可用或者说堪用的虚拟机当属 Parallels Desktop, 至于其他的 VBox、VMware 目前还不成熟; 如果纯 qemu...其本质上利用 docker context 功能, 然后通过将虚拟机中的 sock 文件挂载到宿主机, 并配置 docker context 来实现无缝使用 docker 命令.5.5、虚拟机调整某些情况下...(对应会使用上面目标架构的镜像)arch: "aarch64"Copy六、总结目前整体来看, Docker Desktop 在 mac 上基本上是很难用的, Colima 现在还不太成熟, 适合轻度使用

4K3 0

R语言数据分析有意思的小例子：Prince的歌词挖掘 — 1

歌词文本 text 歌名 song 发行年份 year 专辑 album peak （which shows its placement on the Billboard charts）Billboard上的排名..., : EOF within quoted string 我手动删掉了一些内容后，没有了这个警告 4、使用gsub()函数替换掉歌词文本的一些像won't can't等内容 fix.contractions...sapply(prince$lyrics,removeSpecialChars) 6、将字符转化为小写字母 prince$lyrics<-sapply(prince$lyrics,tolower) 7、使用...37年 year和peak变量中有一些缺失值缺失值可以先保留，根据后续的具体分析内容在做处理 8、将年份划分为年代 library(dplyr) prince% mutate(...image.png 从上图可以清楚的看到发布歌曲最多的是90年代 2、柱形图展示上榜歌曲的数量 df2% filter(peak>0)%>% group_by(decade,

7522 0

R自定义构建函数绘制相关性条形图

❝本节来介绍如何R来自定义构建函数来进行数据处理及绘图，在之前展示案例的基础上进行了一些小的改动，下面通过1个案例来进行展示；加载R包 library(tidyverse) library(magrittr...pivot_longer(-gene) %>% pivot_longer(names_to = "name_2", values_to = "value_2",gene) %>% group_by...,"gene_2","cor","pvalue")) %>% filter(pvalue % arrange(desc(abs(cor)))%>% # dplyr...({{x}} > 0,"#BA7A70","#829BAB")),size=4.1)+ geom_text(aes(x = ifelse({{x}} > 0, -.005, .005),y =...{{y}}, label = gene_2, color=ifelse({{x}} > 0,"#BA7A70","#829BAB

4242 0

「R」数据可视化6 : 曼哈顿图

本文作者蒋刘一琦在生物信息领域我们常常使用R语言对数据可视化。在对数据可视化的时候，我们需要明确想要展示的信息，从而选择最为合适的图突出该信息。...，第二列CHR为所在染色体，第三列BP为染色体上所在位置。...要注意如果你的CHR中存在X，Y这样的，需要给他们转化为数字如赋予23，24等，其中第一列SNP的名字是可选择的，后三列是必须提供的。...library(dplyr) don % # Compute chromosome size group_by(CHR) %>% summarise...>% group_by(CHR) %>% summarize(center=( max(BPcum) + min(BPcum) ) / 2 ) 然后画图的时候geom_point在颜色上进行区分，并使用

2.8K2 0

PD-L1抑制剂-TNBC-续集

= F) library(Seurat) library(ggplot2) library(clustree) library(cowplot) library(dplyr) getwd() setwd.../meta2.xlsx") ##可以看到总共22位患者，11位是atezo+paclitaxel，11位是paclitaxel #其中联合治疗组有5位是PD-L1+，atezo应该使用IC≥1%来划定的...options(stringsAsFactors = F) library(Seurat) library(ggplot2) library(clustree) library(cowplot) library(dplyr..."#3FA116","#CE2820","#9265C1", "#885649","#DD76C5","#7F7F7F","#BBBE00","#41BED1") #使用...右边深蓝色的P013患者髓系和innate lymphoid cells (ILCs)占比很多，这位患者也是PR，使用chemo治疗的。

3012 0

【R语言】dplyr对数据分组取各组前几行

("dplyr") #加载dplyr包 library(dplyr) 我们先来看看直接head的效果 #直接head，结果不对 GO_result %>% group_by(ONTOLOGY) %>...，三类都有方法二、使用top_n #使用top_n r2=GO_result %>% group_by(ONTOLOGY) %>% top_n(n=-5,wt=p.adjust) r2 这里可以使用...方法三、使用slice_head #使用slice_head r3=GO_result %>% group_by(ONTOLOGY) %>% slice_head(n=5) r3 方法四、使用slice_min...会根据指定的p.adjust有小到大排序，然后取每组前5行方法五、使用group_modify结合head #使用group_modify r5=GO_result %>% group_by(ONTOLOGY...如果GO富集结果默认没有按p.adjust排过序，那么就需要选择带有排序的方法，如top_n和slice_min。

1.8K2 1

R语言数据分析笔记——Cohort 存留分析

library('xlsx') library('ggplot2') library('dplyr') library('magrittr') library('tidyr') library('reshape2...2、数据清洗：存留分析使用到的字段只有购买日期、用户ID等信息，分析月度存留，需要将日期规范化成年月形式，同时按照客户id分组，计算出用户首次购买的日期，代码如下： 2.1 创建购买月份字段 df$OrderPeriod...= format(df$OrderDate,'%Y-%m') #购买日期 2.2 创建用户首次购买字段 CohortGroup = df %>% group_by(UserId) %>%...aes(CohortGroup,CohortPeriod,fill=TotalUsers))+ geom_tile(colour='white') + geom_text(aes(label = ifelse...存留分析是互联网数据分析和运用中经常会用到分析工具，本节的R代码是源于篇首Python代码的思路，大家可以对比两者的优劣，作为今后分析使用的参考资料。

1.3K2 0

TidyFriday R 语言中桑基图的一些画法。。。

构造示例数据首先我们需要构造一个示例数据集用于接下来的演示，这里我使用的是我的微信好友数据里面的省份、城市、性别变量。...，可以直接使用我的 friends.csv 数据集： # 使用微信好友数据 library(hrbrthemes) library(tidyverse) library(ggplot2) library...使用 sankeywheel 绘制介绍桑基图画法的教程当然首先要介绍我自己写的 R 包啦，我有一个 sankeywheel 包可以用来绘制桑基图，其实我在探索微信好友数据的那个教程里面已经介绍过了这个...R 包的使用，这里重复下： library(sankeywheel) df %>% group_by(prov, gender) %>% count() %>% ungroup() ->...我们可以通过下面的方式自定义 y 轴的标签： # 修改 y 轴的标签 df %>% count(prov) %>% group_by(prov) %>% summarise(value =

1.3K2 0

R 数据整理（七：使用tidyr和dplyr处理数据框 2.0）

2.2 sample_n dplyr 包的 sample_n(tbl, size) 函数可以从数据集 tbl 中随机无放回抽取 size 行，如: > d.class %>% sample_n(size...在 dplyr 包的 rename() 中用 “新名字 = 旧名字” 格式修改变量名，如： d2.class % dplyr::rename(h=height, w=weight...使用统计相关参数计算列表内相关内容。如sum, mean, median, min, max。...group_by 按照某列对数据框进行分组，非常适合联合summarize 使用，获取指定组别不同类型内容的统计数值。...实际上，tibble 允许存在数据类型是列表 (list) 的列，子数据框就是以列表数据类型保存在 tibble 的一列中的。

10.8K3 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭