开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

在dplyr中使用case_when修改新列时出现问题

，可能是由于以下原因导致的：

语法错误：在使用case_when函数时，需要确保语法正确。case_when函数的语法是case_when(condition1 ~ value1, condition2 ~ value2, ..., TRUE ~ valueN)。每个条件后面需要使用波浪线（~）分隔条件和值。确保每个条件和值都正确地书写。
匹配问题：在case_when函数中，条件是按顺序进行匹配的。如果某个条件匹配成功，后续的条件将不会被考虑。因此，需要确保条件的顺序是正确的，以避免出现问题。
数据类型问题：在使用case_when函数时，需要确保条件和值的数据类型是一致的。如果条件和值的数据类型不匹配，可能会导致错误。可以使用as.函数来进行数据类型转换，例如as.character()、as.numeric()等。
缺失值处理：在使用case_when函数时，需要考虑到可能存在的缺失值。可以使用is.na()函数来判断条件中是否存在缺失值，并进行相应的处理。

解决这个问题的方法是：

检查语法：仔细检查case_when函数的语法，确保每个条件和值都正确地书写。
调整条件顺序：根据实际需求，调整条件的顺序，确保条件按照预期的顺序进行匹配。
数据类型转换：如果条件和值的数据类型不匹配，可以使用as.函数进行数据类型转换，确保一致性。
处理缺失值：使用is.na()函数来判断条件中是否存在缺失值，并进行相应的处理，例如使用ifelse()函数来处理缺失值。

以下是一些腾讯云相关产品和产品介绍链接地址，可以帮助解决云计算中的问题：

云服务器（ECS）：提供可扩展的计算能力，支持多种操作系统和应用场景。了解更多：云服务器产品介绍
云数据库MySQL版（CDB）：提供高可用、可扩展的MySQL数据库服务，适用于各种规模的应用。了解更多：云数据库MySQL版产品介绍
云存储（COS）：提供安全可靠的对象存储服务，适用于存储和处理各种类型的数据。了解更多：云存储产品介绍

请注意，以上链接仅为示例，实际使用时应根据具体需求选择适合的产品和服务。

相关搜索:Case_when和/或if_else dplyr -当NA使用另一列中的值时 dplyr:使用数据帧中n次的连续重复整数来修改新列 dplyr:使用矩阵中的值子集通过case_when创建新列 dplyr，purr，在R中动态生成/计算新列使用dplyr中的组长度创建新列使用dplyr在列中创建新组使用dplyr将新列添加到R中的dataframe 使用mutate和case_when时插入现有列中的值使用r dplyr库在新列中生成聚合数字使用R中其他列的case_when添加新列

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

R&Python Data Science 系列：数据处理（2）

1 衍生字段函数主要有两个函数，mutate()和transmute(）,两个函数在Python和R上使用方法相同，这两个函数本身有点区别：mutate()函数保留原来所有列，然后新增一列；transmute...2 条件函数这里介绍3个条件函数，if_else()、case_when()、between()函数，Python包dfply和R包dplyr中都是这3个函数，在用法上有点细微差别，日常中使用最多...注意：python在jupyter中使用管道函数换行书写代码的时候需要用()把代码括起来。 2.2 case_when函数用于多条件赋值，评分卡Woe赋值的时候使用起来很方便。...注意：case_when函数在Python和R语言中使用的时候有点区别，请留意。...注意：R语言中可以使用XXX_join(a，b，by)，Python中不可以使用。

7501 0

Day07 生信马拉松-数据整理中的R

包 2.1 arrange，数据框按照某一列排序,实际参数不能加" " library(dplyr) arrange(test, Sepal.Length) #从小到大排序 arrange(test,...= T"为必须要写的参数 2.3 mutate，数据框新增一列 test <- mutate(test, new = Sepal.Length * Sepal.Width) #R中的修改必须要赋值，...### library(dplyr) i = rnorm(10) case_when(i>0 ~ "+", i<0 ~ "-", T ~ "0") ★★★★★长脚本的管理方式...test1,test2,by="name") #反连接基本不用 6.表达矩阵画箱线图 6.1操作过程图示 step1 对matrix进行转置：使gene名变为列名，将样本名转化为data.frame中的第一列...ggplot2对行名并不友好，通常要使样本名转化为data.frame中的第一列，防止在后续代码运行过程中行名丢失图片图片 step2 把原来的行名转变为第一列图片 step3 宽变长：test

2110 0

生信马拉松 Day7

50行 pheatmap::pheatmap(x3) #画热图 #使用管道符%>%的代码 iris %>% select(-5) %>% as.matrix() %>% head(50)...require(g,character.only = T)) install.packages(g,ask = F,update = F) } 一个类似的函数case_when() library...(dplyr) i = 0 ifelse(i>0,"+",ifelse(i<0,"-","0")) case_when(i>0 ~ "+", i<0 ~ "-",...4.9500000 3.3833333 1.4500000 0.2333333 apply(test, 1, sum) ### 2.lapply(list, FUN, …) # 对列表/向量中的每个元素实施相同的操作...“ ”转换为NA iris$Species[iris$Species=='']=NA 3.如何删除多余的信息 #这里示例数据中，a$tumor_stage.diagnoses内的数据可能的值有stage

2320 0

数据处理第2节：将列转换为正确的形状

转换列：基础部分您可以使用mutate（）函数创建新列。 mutate中的选项几乎是无穷无尽的：你可以对普通向量做任何事情，可以在mutate（）函数内完成。...mutate中的任何内容都可以是新列（通过赋予mutate新的列名），或者可以替换当前列（通过保持相同的列名）。最简单的选项之一是基于其他列中的值的计算。...通过使用mutate_at（），我们在管道中需要两个参数：首先，它需要有关列的信息。...如果我想在几分钟内完成，我可以使用mutate_at（）并将包含列的所有'sleep'包装在vars（）中。其次，我在飞行中创建一个函数，将每个值乘以60。...如果要添加另一个数据框的信息，可以使用dplyr中的连接函数。

8K3 0

R tips：使用TCGAbiolinks包下载TCGA数据

这个过程中，GDCprepare还会将生存数据自动合并到summarizedExperiment对象的colData中。...summarizedExperiment对象和ExpressionSet等对象类型类似，核心组件就是三大件：表达量、列注释和行注释。...表达量：一个表达量矩阵，行是基因或者相关特征，列是样本或相关特征; 列注释：样本相关的注释，比如病人信息、生存数据等等；行注释：基因相关的注释，比如基因名称、长度、位置、ID等等。...Normalization需要控制的三个不均衡因素是文库大小、基因长度及文库组成：文库大小：比如样本A是样本B的测序量的两倍，那么在同等表达水平下，样本A的基因的Counts值就是B的两倍；基因长度...生存分析时根据基因的中位数将其分为High和Low，使用log-rank检验显著性，也可以使用cox回归。

3K3 1

70-R茶话会15-你的编程菜鸟路上缺失的一课

1-switch和case_when 在做数据分析时，常常遇到的一个场景是，1,2,3 需要转换成其对应的"a","b","c"。比如在对结果进行分类统计的时候。...) c b c c b c c c c a a a b b b b c b a a 3 2 3 3 2 3 3 3 3 1 1 1 2 2 2 2 3 2 1 1 但这样的循环编程语法是低效的，dplyr...提供了向量化的操作[[37-R茶话会07-高效的处理数据框的列]]： > dplyr::case_when( + tmp %in% "a" ~ 1, + tmp %in% "b" ~ 2, +...如果你的脚本中需要你的某些签名或密码，最好不要把他们放在脚本里，因为你的脚本可能会分享给其他人。...可以使用系统变量： Sys.setenv( DSN = "database_name", UID = "User ID", PASS = "Password" ) 接着在脚本中使用这些键即可

3K4 0

R语言基础5（绘图基础）

geom_bar(mapping = aes(x = cut)) ggplot(data = diamonds) + stat_count(mapping = aes(x = cut)) #统计变换使用场景...#https://mp.weixin.qq.com/s/p7LLLvzR5LPgHhuRGhYQBQ 拼图图片图片可以在STHA网站找到现成的代码。...o替换为a，只替换出现的第一个o； str_replace(x,"o|s","a")#将x中的o或者s替换为a，只替换出现的第一个o； str_replace_all(x,"o","a")#将x中的o替换为...a，替换所有的o； str_remove(x," ")##将x中的第一个空格删除； str_remove_all(x," ")##将x中的全部空格删除；图片 library(stringr) str_split...library(dplyr) arrange(test, Sepal.Length) #将Sepal.LengthSepal.Length这一列从小到大排序 arrange(test, desc(Sepal.Length

3197 1

gt包绘制表格详细介绍！

分组操作隐藏、移动某些列列分组操作合并列 & 添加标签使用格式化功能对齐方式及风格主体的字体美化标题和副标题添加脚注 library(gt) library(dplyr) glimpse...包中的union()函数功能差不多。...一次合并2列，第一列的列名会被保留，第2列的列名会被丢弃，默认使用{1} & {2}代替第一列、第二列，支持HTML语法 tab % cols_merge(columns = c...fn = function(x) { # transmission这一列中每行的第一个字符表示speed speed <- substr(x, 1, 1)...# 第2-3个字符表示type,共分成4中type type <- dplyr::case_when( substr(x, 2,

6702 0

使用 R 语言从 PDF 文档中提取表格

由于一个知识星球的小伙伴急需学习如何从 PDF 文档中提取表格，所以先插这个课，「使用 R 语言处理 netCDF 数据」系列的课程下次再发新的哈。...本课程介绍了如何使用 R 语言从 WHO（世界卫生组织）的官网上下载新冠疫情的每日报告以及如何从这些报告中的表格里面提取数据。... 标签的 href 属性，然后过滤出链接中含 .pdf 的，最后再用一个循环下载所有的 PDF 文件即可。...包，因此在使用这个包之前你需要在电脑上安装 Java 和在 R 里面安装 rJava 包。...", "Days_since_last_reported_case")) %>% mutate(Reporting_Country_Territory_Area = case_when

3.5K1 0

roughnet绘制带有纹理填充的网络图

欢迎关注R语言数据分析指南 ❝本节来介绍一款R包「roughnet」其最主要用来绘制网络图时添加纹理填充，小编测试后发现挺有趣的有多了一种图形展示方式。...igraph) install.packages(c("signnet","graphlayouts")) library(signnet) library(graphlayouts) library(dplyr...) 绘制纹理填充网络图 g <- make_graph("Zachary") # 创建一个名为 "Zachary" 的图形对象 V(g)$shape <- "circle" # 将图形中的节点形状设置为圆形...ifelse(E(main)$sign == 1, 3, 1) # 根据边的符号（sign）确定边的宽度 xy <- layout_with_stress(main, weights = 1/w) # 使用..."n", "s", "s", "s", "s", "e", "n", "e", "s", "n") # 设置节点的位置属性 # 创建一个宽度为 600，高度为 600 的 roughnet 图形，使用

1332 0

生信入门马拉松之R语言基础-脚本项目管理、条件循环、表达矩阵和一丢丢数据挖掘(Day 7)

save(pd,exp,gpl,file = "steploutput,Rdata")，这句代码将几个第一个脚本有用的变量保存到Rdata文件中，下次使用这些变量时直接加载load这个Rdata文件即可...undefined表格文件需要赋值，读取参数不同导致读取结果不同，不能在后续代码中同等处理。Rdata可以保存多个变量，下次使用只需要一次load可以的到多个数据。...代码2实现结果和代码1相同2.6 练习library(dplyr)x = c(-1,-1,4,5,2,0)case_when(x>0 ~ "A", x==0 ~ "0",...加载test1.Rdata，将两个数据框按照probe_id列连接在一起，按共同列取交集load("test1.Rdata")library(dplyr)merge1 <- merge(dat,ids,...表达矩阵：一行是一个基因在所有样品里的表达，一列是一个样本里所有基因的表达。在表达矩阵中，寻找在不同组有表达差异的基因。

1260 0

生信技能树- R语言-day7

sort是给向量排序的library(dplyr)arrange(test, Sepal.Length) #默认根据这一列从小到大给整个数据框排序arrange(test, desc(Sepal.Length...duplicated(mm)] 提取没有重复的第一次出现的mutate，数据框新增一列mutate(test, new = Sepal.Length * Sepal.Width) new是新产生的列名新加之后...，如果没有赋值，那么这个数据框还是没有新加，没有赋值，就没有产生补充select（）filter（）如何简化连续的步骤1....else2， ifelse（，，ifelse）在ifelse里加一个ifelse补充 case_when练习题1.加载deg.Rdata,根据a、b两列的值，按照以下条件生成向量x：load("deg.Rdata...取头几个tail 取尾巴的几个还没做思考题：如何跳出一个表达矩阵里方差最大的1000个基因思考题：取出大于1的所有行向量/列表的隐式循环-lapplylapply(list, FUN, …)对列表/向量中的每个元素实施相同的操作

730 0

答读者问：R语言ggplot2画气泡图展示相关性分析的结果~文末留言送书

有读者在公众号后台留言问下图应该如何实现 image.png image.png 实现这个图的办法很多，今天的推文介绍使用R语言ggplot2包实现这个图的方法。...第一步是准备数据部分数据集如下 image.png image.png 总共4列前两列是变量第三列是相关系数第四列是显著性P值前面的变量需要注意的是，因为只画上三角，所以准备数据的时候是...：总共的变量是10个第一列10个x1，接下来是紧接着9个x2,然后是8个x3 第一步树读入数据 df<-read.csv("20210320.csv",header=T) head(df) 增加一列显著性的星号...library(dplyr) df%>% mutate(label=case_when( signi<0.001 ~ "***", signi>0.001&signi<0.01 ~...1,1,0.2))+ scale_size_continuous(range = c(5,15))+ guides(size=F) 这样就对了 image.png 接下来是添加文字，首先把对角线那一列去掉

2.2K2 0

ggpol包优雅的绘制蝴蝶图

ungroup() %>% # 解除分组 unite(col = "status_gender", gender, status, sep = "_") %>% # 将性别和选举状态合并成一个新的列...构建数据用于在图形中添加空白区域 dummy_constituency = tibble(y = c(-max(results$y), 0, 0, max(results$y)), # y值为最大最小值及其负值...gender = c("female", "female", "male", "male")) %>% # 性别列 mutate(gender_label = case_when...映射选区、y值和主导性别 shape = 19,size = 4) + geom_blank(data = dummy_constituency, # 添加空白图层，使用虚拟选区数据..., dir = "h", scales = "free", reverse_num = TRUE) + # 分面显示，根据性别标签分面 coord_flip() + # 翻转坐标轴，使选区显示在y

2341 0

超强的gtSummary ≈ gt + comparegroups ??

自动识别常见的回归模型，如逻辑回归和Cox比例风险回归，会在表格中自动填充适当的列标题(即优势比和风险比)。高度自定义的表格。字体字号、增加P值，合并单元格等，通通支持自定义。...本期目录：安装 tbl_summary 基本使用自定义输出修改统计方法同一个变量展示多个统计量交叉表和compareGroups包进行比较安装 # 2选1 install.packages...修改统计方法可以为不同的列自定义不同的统计方法。...trial2 %>% tbl_summary( by = trt, # 分组 # 根据变量类型选择显示方式，和case_when()的使用非常像哦 statistic...使用as_gt()函数转换为gt对象后们就可以使用gt包的函数了。

1.6K8 0

玩转数据处理120题｜R语言版本

题目：修改第二列列名为'popularity' 难度：⭐⭐ R语言解法 df % rename(popularity = score) 5 字符统计题目：统计grammer列中每种编程语言出现的次数...how：any-只要有空值就删除（默认），all-全部为空值才删除 inplace：False-返回新的数据集（默认），True-在原数据集上操作 57 数据可视化题目：绘制收盘价的折线图难度：⭐...=3)) 98 数据修改题目：将数据按照第三列值的大小升序排列难度：⭐⭐ R语言解法 df % arrange(col3) 99 数据修改题目：将第一列大于50的数字修改为'...#基本思想先读取较少的数据获取列名 #给目标列以外的列打上NULL导致第二次读取文件时NULL列丢失即可 res <- read.csv('数据1.csv',encoding = 'GBK',nrows...难度：⭐⭐ 备注从数据2中读取数据并在读取数据时将薪资大于10000的为改为高 R语言解法 library(readr) df2 % mutate

8.7K1 0

UseGalaxy.cn生信云|零代码使用Tiverse优雅地处理数据集

Dplyr Distinct keep unique rows distinct 函数用于去除数据框中的重复观测，仅保留唯一的观测。它可以基于指定的列对数据框进行去重操作，确保每个观测都是唯一的。...Dplyr Mutate create, modify, and delete columns mutate 函数用于添加新变量或修改现有变量，能够基于已有数据创建新的变量列，支持对数据框进行实时的变量操作和修改...Dplyr Rename columns rename 函数用于重命名数据框中的变量名，能够快速修改变量的名称，使得数据的列名更符合用户的需求和习惯。...Dplyr Select keep or drop columns select 函数用于选择数据框中的特定列，可以保留感兴趣的变量，并且能够根据列名、位置或条件表达式进行灵活的变量选择操作。...Dplyr Slice select rows by position slice 函数用于按行数进行切片，能够从数据框中提取特定的行，支持根据行数或行号选择需要的行，也支持使用负数表示从末尾开始计算的行数

1532 0

大更新，pandas终于有case_when方法了！

数分小伙伴们都知道，SQL中的case when语句非常好用，尤其在加工变量的时候，可以按照指定的条件的进行赋值，并且结合其他嵌套用法还可以实现非常强大的功能。...二、case_when用法东哥了解了一下case_when用法，总结了以下几点要点。对象：case_when属于series对象的方法，dataframe对象无法使用。...[90, 84, 69, 73, 98, 83], physic = [84, 58, 74, 93, 87, 86] )) df 首先，对三科考试求和生成总分数新列...df['score_all'] = df.sum(axis=1) 对加工的总成绩列使用case_when方法，生成1-5的排序等级。...替换值：替换值使用了lambda隐函数对输入series计算。这就是case_when非常灵活的原因，判断条件和替换值既可以是固定的值，也可以是自定义的函数，根据自己的需求随意设置。

2041 0

Day3-学习R包

这里选择的是中国清华大学的镜像服务器，这样做的好处是在国内下载R包时速度会更快。...library(dplyr)：这行代码加载了之前安装的 dplyr 包，使其函数可以在当前R会话中使用。...五个基础函数 mutate() 函数是 dplyr 包提供的一个用于修改数据框（data frame）的函数，它可以创建新的列或者修改现有的列。...创建一个名为 new 的新列，该列的每个值是对应行中 Sepal.Length 和 Sepal.Width 的乘积 select(test,1) ##从数据框 test 中选择第一列。...select() 函数是 dplyr 包提供的一个用于选择数据框（data frame）中特定列的函数。

1141 0

R 数据整理（七：使用tidyr和dplyr处理数据框 2.0）

这些变量应该是真正的属性，而不是同一属性在不同年、月等时间的值分别放到单独的列。...在 dplyr 包的 rename() 中用 “新名字 = 旧名字” 格式修改变量名，如： d2.class % dplyr::rename(h=height, w=weight...对于待分离的对象（col），不必加上引号；但对于即将创建的新列（into），需要使用引号，由于是两列，这里使用向量创建。sep参数设定读取表格信息时以何符号作为分隔符。...对于即将合并的新列，需要使用引号；但对于想要合并的多个列名，可以不用使用引号。sep 参数设定多列合并后不同数据分隔使用的分割符。...nest 与unnest 对于数据框，我们可以使用split 将数据框按某列拆分为多个数据框，并储存在列表中。

10.7K3 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭