开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

匹配dplyr条件，但返回备用选项

在R语言的dplyr包中，case_when()函数是一个非常强大的工具，它允许你根据多个条件来选择不同的值。如果你想要匹配某些条件，但在没有匹配到时返回一个备用选项，case_when()函数非常适合这个任务。

基础概念

case_when()函数允许你指定一系列的条件和对应的返回值。如果没有条件匹配，它会返回NA。如果你想要在没有匹配时返回一个特定的值，可以在条件的最后添加一个默认的条件。

优势

清晰性：通过链式的语法，使得代码易于阅读和维护。
灵活性：可以处理复杂的逻辑判断，适用于多种场景。
效率：dplyr包优化了数据处理流程，使得case_when()在执行时相对高效。

类型

case_when()主要用于处理分类数据和条件逻辑。

应用场景

数据清洗：根据不同的条件转换或筛选数据。
数据分析：对数据进行条件性的统计或汇总。
数据可视化：根据条件为数据点着色或分类。

示例代码

假设我们有一个数据框df，其中包含一列名为score的分数，我们想要根据分数的不同范围来标记等级，并且如果没有匹配到任何范围，则标记为"无效"。

library(dplyr)

# 创建示例数据框
df <- data.frame(score = c(85, 72, 93, 60, 55, 105, -5))

# 使用case_when()函数
df <- df %>%
  mutate(
    grade = case_when(
      score >= 90 ~ "A",
      score >= 80 ~ "B",
      score >= 70 ~ "C",
      score >= 60 ~ "D",
      TRUE ~ "无效"  # 这是备用选项，如果没有匹配到前面的条件，就返回"无效"
    )
  )

print(df)

解释

score >= 90 ~ "A" 表示如果分数大于等于90，则等级为"A"。
score >= 80 ~ "B" 表示如果分数大于等于80，则等级为"B"。
TRUE ~ "无效" 是一个默认条件，表示如果没有匹配到前面的任何条件，则等级为"无效"。

遇到的问题及解决方法

如果你在使用case_when()时遇到了问题，比如没有返回预期的结果，可能的原因包括：

条件顺序错误：确保你的条件是从最具体到最一般的顺序排列。
逻辑错误：检查每个条件的逻辑是否正确。
数据类型问题：确保参与比较的数据类型是一致的。

解决方法：

调试：可以逐个条件地测试，看看哪个条件没有按预期工作。
使用debug()函数：在复杂的逻辑中，可以使用R的调试工具来逐步执行代码并查看每一步的结果。

通过以上方法，你应该能够有效地使用case_when()函数，并解决在使用过程中可能遇到的问题。

相关搜索:索引/匹配，返回匹配条件的结果列表 Dplyr: Group by，然后根据不同的条件返回top 返回列表或选项的匹配类型较大的假设条件，但需要根据条件匹配名称 if语句返回true，但条件不会触发 MySQL仅返回匹配条件的结果如果条件不匹配，则返回空返回子数组的父属性匹配条件如果条件匹配则返回TRUE的公式？Node Mongoose虚拟属性返回下级匹配条件 Mongoose FindOne -仅返回匹配条件的字段无痛脚本Kibana 6.4.2不使用匹配器匹配，但使用表达式条件匹配使用dplyr按条件计算值，但最终得到一行的dataframe 在多个条件上进行红移联接，但仅在其中一个条件不匹配时返回返回某些IN条件不匹配的默认值用VBA抓取Web返回匹配条件的数据根据条件或ID匹配和返回值字符串匹配函数返回数组，但如果转换为数字，则返回匹配的数字如何在MongoDB中返回数组匹配条件的元素如何返回所有可能的条件二部匹配？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

数据处理第3部分：选择行的基本和高级的方法

在某些情况下，虽然需要根据部分匹配进行过滤。在这种情况下，我们需要一个函数来评估字符串上的正则表达式并返回布尔值。每当语句为“TRUE”时，该行将被过滤。...这有两个主要选项：base R的grepl（）函数，或stringr包中的str_detect（）。无论何时寻找部分匹配，重要的是要记住R是区分大小写的。...以上示例基于单个条件返回行，但filter选项还允许AND和OR样式过滤器： *filter（condition1，condition2）将返回满足两个条件的行。...condition2）将返回条件1为真但条件2不为的所有行。 *filter（condition1 | condition2）将返回满足条件1和/或条件2的行。...*filter（xor（condition1，condition2）将返回只满足其中一个条件的所有行，而不是满足两个条件时。可以组合多个AND，OR和NOT条件。

1.3K1 0

R︱高效数据操作——data.table包（实战心得、dplyr对比、key灵活用法、数据合并）

2、按条件行筛选从前用subset的方式进行筛选比较多， new=14,select=a:f) （1）单变量现在data.table与dplyr from_dplyr =...—————————————————————————————————————————————— 六、额外的参数（来源：R语言data.table速查手册） 1、mult参数 mult参数是用来控制i匹配到的哪一行的返回结果默认情况下会返回该分组的所有元素...返回匹配到键值所在列(V2列)所有行中的第一行 > DT["A", mult ="first"] V1 V2 V3 V4 1: 1 A -1.1727 1 2、nomatch参数——未匹配样本处理...nomatch参数用于控制，当在i中没有到匹配数据的返回结果，默认为NA，也能设定为0。...0意味着对于没有匹配到的行将不会返回。

9.3K4 3

数据处理|R-dplyr

1）安装、加载dplyr包、准备数据 install.packages("dplyr") #加载dplyr包使用dplyr包处理数据前，建议先将数据集转换为tbl对象。...2）数据记录筛选（行筛选） filter函数:按指定条件筛选符合条件中逻辑判断要求的数据记录。...6）数据汇总 summarize()函数实现数据集聚合操作，将多个值汇总成一个值 summarise(iris,avg = mean(Sepal.Length)) 利用概述函数概括数据，输入数值向量而返回单一数值...Min ；Max Mean ；Median ；Var ；Sd等 summarise(iris, max(Petal.Width), first(Sepal.Width)) #返回数据框中变量的最大值及第一四分位值...(x,y,by = NULL) #内连接，合并数据仅保留匹配的记录 by设置两个数据集用于匹配的字段名，默认使用全部同名字段进行匹配，如果两个数据集需要匹配的字段名不同，可以直接用等号指定匹配的字段名

2K1 0

生信星球学习小组Day6笔记--学习R包高小能

包的使用是一通百通的，我们以dplyr为例，讲一下R包。...安装和加载R包1.镜像设置为了保证我们可以自定义CRAN和Bioconductor的下载镜像，其实是可以在Rstudio中进行设置的，只需要运行这两行代码即可：# options函数就是设置R运行过程中的一些选项设置...图片加载library(dplyr)示例数据直接使用内置数据集iris的简化版:test dplyr五个基础函数1.mutate(),新增列mutate...两个实用技能管道操作 %>% (cmd/ctr + shift + M)count统计某列的unique值dplyr处理关系数据图片1.內连inner_join,取交集2.左连left_join3.全连...full_join4.半连接：返回能够与y表匹配的x表所有记录semi_join5.反连接：返回无法与y表匹配的x表的所记录anti_join

1670 0

R语言数据集合并、数据增减、不等长合并

数据选取与简单操作： which 返回一个向量中指定元素的索引 which.max 返回最大元素的索引 which.min 返回最小元素的索引 sample 随机在向量中抽取元素 subset 根据条件选取元素...sort 升序排列元素 rev 反转所有元素 order 获取排序后的索引 table 返回频数表 cut 将数据分割为几部分 split 按照指定条件分割数据 rbind 行合并 cbind 列合并...a,b数据集的并，都有的才匹配出来，如果a、b数据集ID不同，要用all=T（下面有all用法的代码）。...包 dplyr包的数据合并，一般用left_join(x,y,by="name") 以x为主，y中匹配到的都放进来，但，y中没有的则不放过来。...2、dplyr包 dplyr::bind_rows() mpg cyl hp drat wt qsec vs am gear carb disp (dbl

13.6K1 2

Day6 呦呦鹿鸣—学习R包

)以dplyr包为例官方包的文档dplyr示例数据test % select(Species, Sepal.Length)3.filter()筛选行/返回具有匹配条件的行可以按照某分类变量的值进行数据筛选...处理关系数据将2个表进行连接1.內连inner_join,取交集inner_join(test1, test2, by = "x")满足两个条件：有相同变量名，相同变量名的列里有相同元素；2.左连left_join...full_joinfull_join( test1, test2, by = 'x')列表书写顺序决定了最终合成列表中列的顺序,每列数值的类型必须相同；以"by"的列为标准，补齐列表，空值为"NA"4.半连接：返回能够与...y表匹配的x表所有记录semi_join交集表中test1部分的列semi_join(x = test1, y = test2, by = 'x')5.反连接：返回无法与y表匹配的x表的所记录anti_jointest1

1711 0

生信星球Day4 学习R包

/p/861224f4251aoptions() 设置R运行过程中的一些选项设置options()$repos 查看使用install.packages安装时的默认镜像options()$BioC_mirror...="https://mirrors.ustc.edu.cn/bioc/") install.packages("dplyr") #或BiocManager::install("dplyr")library...(dplyr)dplyr五个基础函数mutate() 新增列，(x，列名=相关数据)select() 筛选列，（x，列号或列名）filter() 筛选行，（x，列名==想要的行）需要逻辑判断arrange...內连，取交集，by="x"基于x的列left_join() 左连，保留前一个表，以此多舍少补后一个表full_join() 全连semi_join(x= ,y= ,by="某列") 半连接，返回能够与...y表匹配的x表所有记录anti_join(x= ,y= ,by="某列") 反连接，返回无法与y表匹配的x表所有记录简单合并bind_rows()需要两个表格列数相同，上下连接；bind_cols()

2114 0

学习R包

dplyr包有很多函数，为了防止dplyr包中的函数名与其他函数产生冲突，使用时前面加上“包名::”dplyr五个基础函数mutate(),新增列select(),按列筛选按列号筛选注意筛选内容与表格内容的统一...inner_join,取交集左连left_join全连full_join半连接：返回能够与y表匹配的x表所有记录semi_joinSemi-Join半连接，当外表在内表中找到匹配的记录之后，Semi-Join...会返回外表中的记录。...但即使在内表中找到多条匹配的记录，外表也只会返回已经存在于外表中的记录。...注意返回的表的不同反连接：返回无法与y表匹配的x表的所记录anti_join注意返回的表的不同简单合并在相当于base包里的cbind()函数和rbind()函数;注意，bind_rows()函数需要两个表格列数相同

1231 0

生信学习小组day6--大姚

CRAN/")) ##镜像的网址不一定要用清华源 options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") install.packages("dplyr...") library(dplyr) 示例数据采用内置数据集iris的简化版 test <- iris[c(1:2,51:52,101:102),] 二、dplyr五个基础函数 1.mutate(),新增列...Species == "setosa" filter(test, Species == "setosa"&Sepal.Length > 5 )##在第一行代码的基础上增加一个筛选条件，要同时满足这两个筛选条件...by = 'x') left_join(test2, test1, by = 'x') 3.全连full_join full_join( test1, test2, by = 'x') 4.半连接：返回能够与...y表匹配的x表所有记录semi_join semi_join(x = test1, y = test2, by = 'x') 5.反连接：返回无法与y表匹配的x表的所记录anti_join anti_join

8180 0

生信星球学习小组Day6-R包学习 Jerry

Rstudio程序设置中设置，可以用options()$repos来检验，但有时候还是不能成功，也不能下载Bioconductor的包（2）代码设置 # options函数就是设置R运行过程中的一些选项设置...mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源 options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源 # 可以换成其他地区的镜像但这种方法每次打开...") library(dplyr) test <- iris[c(1:2,51:52,101:102),] #示例数据 2. dplyr五个基础函数 a. mutate(),新增列 mutate(test...半连接：返回能够与y表匹配的x表所有记录semi_join semi_join(x = test1, y = test2, by = 'x') ## x z ## 1 b A ## 2 e B ##...反连接：返回无法与y表匹配的x表的所记录anti_join anti_join(x = test2, y = test1, by = 'x') ## x y ## 1 a 1 ## 2 c 3 ##

2082 1

Day6-蓝色柠檬

以dplyr包的安装加载和使用为例进行学习，因为R包之间的使用是相通的，掌握了一个，后面的可以通过具体代码的学习进行使用。dplyr这个包我以前没有接触过，从这个入手，又能学习到新东西真不错。...# options函数就是设置R运行过程中的一些选项设置options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #...")library(dplyr)R包安装命令是install.packages(“包”)或者BiocManager::install(“包”)。...4.3全连full_joinfull_join( test1, test2, by = 'x') #把数据全部展示出来，同时能够从x处找到交集的放在上面，不能找到的放在下面，但是要都表现出来4.4半连接：返回能够与...y表匹配的x表所有记录semi_joinsemi_join(x = test1, y = test2, by = 'x')4.5反连接：返回无法与y表匹配的x表的所记录anti_joinanti_join

2282 0

day 6 字符串数据框条件循环隐式循环

需要的包：library(tidyr)library(dplyr)library(stringr)library(tibble)字符串stringr包x 匹配到的元素str_replace_all...(x2,"o","A") #替换每个字符串中所有匹配到的元素6.字符删除xstr_remove(x," ")str_remove_all(x," ")数据框test 条件语句1.if(){ } 带有{}表示这一段代码可以被折叠(1)只有if没有else，那么条件是FALSE时就什么都不做运用：下载数据的代码，保留但不反复运行# if...tumor3","normal1","normal2","normal3")k1 = str_detect(samples,"tumor");k1 #string包中的函数：samples中有tumor的位置返回的结果为

470 0

从头学R语言——DAY 3

包dplyr作为tidyverse中的核心包之一，主要用于数据转换。...因为用ggplot等进行可视化，必须要求数据格式完全符合要求，但这种情况极其罕见，所以我们需要dplyr来转换数据。...此处先掌握dplyr的5个基本函数：mutate()，select()，filter()，arrange()，summaries()；1个重要的管道工具%>%#用dplyr包进行数据转换#5个核心函数test...(test1, test2, by = 'x')#全连接，取并集full_join( test1, test2, by = 'x')#半连接，返回能够与y表匹配的x表所有记录semi_join(x =...test1, y = test2, by = 'x')#反连接，返回不能与y表匹配的x表所有记录anti_join(x = test1, y = test2, by = 'x')列名下3或4个字母的缩写

841 0

Python & R 控制流大比拼！建议收藏！

dplyr包中的case_when。..."0" case_when会从第一个条件开始判断，是T就输出相应的值，是F就再判断下一个条件。...循环语句 z = range(1, 6) # range函数不包括结束值，所以返回5个值 for i in z: print(i) ps = ["tidyr", "dplyr", "stringr...files 匹配以csv为结尾的文件 result = list() for (i in 1:length(files)) {...150 5 Python批量读取文件 Python中，我们可以使用类似的方式来批量读取文件： from glob import glob import pandas as pd # 用正则表达式匹配以

590 0

干货 | 男朋友老是说自己R语言很6，快来用这40道题目检测他

因此，g(x)会返回8，所以A选项是正确答案。...因此选项C是正确答案。 21 “dplyr”是R中最流行的工具包之一，它包括5个核心数据处理函数。下面选项中的哪一个不是dplyr中的核心函数？...<50) C) 以上全部 D) 以上都不是答案: (A) dplyr中的filter函数使用“,”来添加条件，而不是“&”。...since”,A) C) regexec(“because”,”since”,A) D) None of the above 答案：（A） sub命令仅替换字符串中第一次出现的单词，而regexec将返回匹配的位置列表...，如果没有匹配则返回-1。

2K4 0

linux必学的文件及内容查找命令

“在linux环境下，我们经常要查找一个文件或者文件的内容，但搜索的命令有很多，这些命令都有什么区别，应该怎么选择和使用呢？下面总结了一些常见的文件查找、内容查找的命令，收藏起来备用吧。...该命令通常会返回大量匹配项，可以使用 -r 选项通过正则表达式来精确匹配。 centos默认没有该命令，需要安装yum install mlocate，然后执行updatedb初始化文件库。...格式：locate [选项] 文件名常用参数 -i：忽略大小写 -l：仅输出几行的意思，例如输出5行则是-l 5； -r :后面可接正则表达式的显示方式 -c：不输出文件名，仅计算找到的文件数量；常用使用案例...格式：find + 查找的路径 + 参数 + 限定条件常用参数： -name：按照名称查找 -type：安装文件类型查找（“f”表示文件，"d"表示文件夹） -size：根据大小查找 -perm：根据权限查找...查找一般文件优先使用whereis和locate，两个都搜索不到或者需要使用更多条件搜索再使用find。

3K3 0

生信学习小组Day6笔记—Chocolate Ice

--微信公众号：生信星球首先用file.edit('~/.Rprofile')打开.Rprofile文件；然后在.Rprofile文件内添加下列两行代码# options函数就是设置R运行过程中的一些选项设置...install.packages(“包”):安装CRAN官网的包BiocManager::install(“包”)：安装Biocductor的包加载R包library(包)或者require(包)Rstudio中包只需要安装一次，但每次启动都需要重新加载...R包dplyr包的五个基础函数以R自带的iris数据框为例test 匹配半连接：返回能够与y表匹配的x表所有记录semi_joinsemi_join(x = test1, y = test2..., by = 'x')反连接：返回无法与y表匹配的x表的所记录anti_joinanti_join(x = test2, y = test1, by = 'x')简单合并bind_rows()函数需要两个表格列数相同

7553 0

Day6生信入门—R包

下面以dplyr为例，学习R包安装和加载R包初级模式通过options()$repos检验升级模式为了保证可以自定义CRAN和Bioconductor的下载镜像，只需要运行这两行代码即可：...options函数就是设置R运行过程中的一些选项设置 options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源...") library(dplyr) 示例数据直接使用内置数据集iris的简化版: test <- iris[c(1:2,51:52,101:102),] dplyr五个基础函数注意，井号开头的是代码运行记录...'x') left_join(test2, test1, by = 'x') ## 3.全连full_join full_join( test1, test2, by = 'x') ## 4.半连接：返回能够与...y表匹配的x表所有记录semi_join semi_join(x = test1, y = test2, by = 'x') ## 5.反连接：返回无法与y表匹配的x表的所记录anti_join anti_join

5442 0

优化查询性能（三）

查询总是FALSE:在少数情况下，InterSystems IRIS可以在准备查询时确定查询条件总是FALSE，因此不能返回数据。“显示计划”会在“查询计划”组件中通知这种情况。...例如，包含条件的查询WHERE %ID IS NULL 或 WHERE Name %STARTSWITH('A') AND Name IS NULL不能返回数据,因此，InterSystems IRIS...这种条件检查仅限于涉及NULL的几种情况，并不是为了捕捉所有自相矛盾的查询条件。无效的查询:Show Plan为大多数无效查询显示SQLCODE错误消息。...使用备用的“显示计划”工具: 输入一个SQL查询文本，或使用Show History按钮检索一个。可以通过单击右边的圆形“X”圆来清除查询文本字段。按显示计划选项按钮以显示多个备用显示计划。...如果此EOS字符串与缓存的查询分隔符不匹配，则不会生成输出文件。 schemapath 可选-以逗号分隔的方案名列表，用于为未限定的表名、视图名或存储过程名指定方案搜索路径。

1.2K2 0

学习小组Day6-bubble

1.安装并加载R包1.1 镜像设置也和Linux一样，官方源因受到网速影响比较慢，添加国内镜像源会方便很多这里需要用到两行代码# options函数就是设置R运行过程中的一些选项设置options("repos...")library(dplyr)示例数据直接使用内置数据集iris的简化版:test dplyr包的五个基础函数2.1 mutate(),新增列mutate(test, new = Sepal.Length * Sepal.Width)2.2 select(),按列筛选① 按列号筛选...test2, by = 'x')left_join(test2, test1, by = 'x')③ 全连full_joinfull_join( test1, test2, by = 'x')④ 半连接：返回能够与...y表匹配的x表所有记录semi_joinsemi_join(x = test1, y = test2, by = 'x')⑤ 反连接：返回无法与y表匹配的x表的所记录anti_joinanti_join

2575 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭