开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

dplyr:使用矩阵中的值子集通过case_when创建新列

dplyr是一个在R语言中用于数据处理和操作的包，它提供了一组简洁而强大的函数，可以帮助用户对数据进行筛选、排序、汇总、变形等操作。在dplyr中，可以使用矩阵中的值子集通过case_when函数创建新列。

case_when函数是dplyr包中的一个条件语句函数，它可以根据一系列条件对数据进行分类和转换。通过使用case_when函数，我们可以根据矩阵中的值子集来创建新的列，根据不同的条件将数据进行分类或者进行特定的数值转换。

使用case_when函数的一般语法如下：

new_column <- case_when(
  condition1 ~ value1,
  condition2 ~ value2,
  ...
  conditionN ~ valueN,
  TRUE ~ default_value
)

在上述语法中，condition1、condition2等表示条件，value1、value2等表示对应条件的值，TRUE表示默认条件，default_value表示默认值。根据条件的顺序，case_when函数会逐个判断条件，如果满足某个条件，则返回对应的值，如果不满足任何条件，则返回默认值。

下面是一个示例，展示如何使用矩阵中的值子集通过case_when函数创建新列：

library(dplyr)

# 创建一个示例矩阵
matrix_data <- matrix(c(1, 2, 3, 4, 5), nrow = 5, ncol = 1)

# 将矩阵转换为数据框
data <- as.data.frame(matrix_data)

# 使用case_when函数创建新列
data <- data %>%
  mutate(new_column = case_when(
    matrix_data > 3 ~ "大于3",
    matrix_data <= 3 ~ "小于等于3",
    TRUE ~ "其他"
  ))

在上述示例中，我们首先创建了一个示例矩阵matrix_data，然后将其转换为数据框data。接下来，使用mutate函数和case_when函数创建了一个名为new_column的新列。根据矩阵中的值子集，如果值大于3，则新列的值为"大于3"；如果值小于等于3，则新列的值为"小于等于3"；如果不满足任何条件，则新列的值为"其他"。

通过这种方式，我们可以根据矩阵中的值子集，灵活地创建新的列，以满足不同的数据处理需求。

腾讯云相关产品和产品介绍链接地址：

腾讯云官网：https://cloud.tencent.com/
云服务器（CVM）：https://cloud.tencent.com/product/cvm
云数据库 MySQL 版：https://cloud.tencent.com/product/cdb_mysql
人工智能平台（AI Lab）：https://cloud.tencent.com/product/ailab
物联网开发平台（IoT Explorer）：https://cloud.tencent.com/product/explorer
移动开发平台（移动推送）：https://cloud.tencent.com/product/umeng_push
对象存储（COS）：https://cloud.tencent.com/product/cos
区块链服务（BCS）：https://cloud.tencent.com/product/bcs
腾讯云元宇宙：https://cloud.tencent.com/solution/virtual-world

相关搜索:Case_when和/或if_else dplyr -当NA使用另一列中的值时 dplyr:：使用另一列的订单号创建新列使用dplyr mutate根据列名的向量创建新列使用dplyr中的组长度创建新列使用dplyr在列中创建新组使用dplyr更新R中的值以对行进行子集使用dplyr根据另一列的值之和创建新列使用pandas中其他列的值名创建新列使用R中其他列的case_when添加新列使用两列中的值在Pandas中创建新列

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Day07 生信马拉松-数据整理中的R

str_remove_all(x," ") #删除全部目标字符 2.玩转data.frame--dplyr包 2.1 arrange，数据框按照某一列排序,实际参数不能加" " library(dplyr...### library(dplyr) i = rnorm(10) case_when(i>0 ~ "+", i<0 ~ "-", T ~ "0") ★★★★★长脚本的管理方式...6.1操作过程图示 step1 对matrix进行转置：使gene名变为列名，将样本名转化为data.frame中的第一列 ggplot2对行名并不友好，通常要使样本名转化为data.frame中的第一列...#是b的下标，可以给b取子集，也可以给与b对应的其他向量取子集。...dir() # 列出工作目录下的文件 dir(pattern = ".R$") #列出工作目录下以.R结尾的文件 file.create("douhua.txt") #用代码创建文件 file.exists

2230 0

R语言基础5（绘图基础）

str_detect(x,"h")##是否含有关键词h，生成与X长度相等的逻辑值向量，可用于向量取子集； str_detect(x,"h|s")##是否含有关键词h或者s，生成与X长度相等的逻辑值向量...，可用于向量取子集； str_starts(x,"h")##是否以h开头，生成与X长度相等的逻辑值向量，可用于向量取子集； str_ends(x,"h")##是否以h结束，生成与X长度相等的逻辑值向量，...可用于向量取子集； str_replace(x,"o","a")#将x中的o替换为a，只替换出现的第一个o； str_replace(x,"o|s","a")#将x中的o或者s替换为a，只替换出现的第一个...##将x中的全部空格删除；图片 library(stringr) str_split(x," ")##按照空格分隔 str_split(x," "，simplify=T)##列表简化为矩阵玩转数据框...#x是数据框或者矩阵 #margin为行则是1，margin为列是2; #fun为函数 #apply(test,2,mean) #对test的每一列求平均值 sort(x) #对x从小到大排序 head

3347 1

如何使用Excel将某几列有值的标题显示到新列中

如果我们有好几列有内容，而我们希望在新列中将有内容的列的标题显示出来，那么我们怎么做呢？ Excel - TEXTJOIN function 1....- - - - 4 - - - 在开始，我们曾经使用INDEX + MATCH的方式，但是没有成功，一直是N/A https://superuser.com/questions/1300246/if-cell-contains-value-then-column-header...所以我们后来改为TEXTJOIN函数，他可以显示值，也可以显示值的标题，还可以多个列有值的时候同时显示。...- - 4 - - - 15 Year 5 - - - - 5 - - - =TEXTJOIN(", ",TRUE,IF(ISNUMBER(B2:I2),$B$1:$I$1,"")) 如果是想要显示值，...则： =TEXTJOIN(", ",TRUE,IF(ISNUMBER(B2:I2),B2:I2,"")) 其中，ISNUMBER(B2:I2)是判断值是不是数字，可以根据情况改成是不是空白ISBLANK

11.3K4 0

生信技能树- R语言-day7

TURE，生成长度相等的逻辑值向量，可以用来取子集，可以提出来含有h的地雷str_starts(x2,"T") #是否以t开头str_ends(x2,"e")#是否e结束5.字符串替换x2str_replace...duplicated(mm)] 提取没有重复的第一次出现的mutate，数据框新增一列mutate(test, new = Sepal.Length * Sepal.Width) new是新产生的列名新加之后...else2， ifelse（，，ifelse）在ifelse里加一个ifelse补充 case_when练习题1.加载deg.Rdata,根据a、b两列的值，按照以下条件生成向量x：load("deg.Rdata...这是一个矩阵2. 先转置3. 把行名变成一列4. “宽”变成“长”把格式变成类似于 ggplot2的形式，一列作为x，一列作为y5....#是b的下标，可以给b取子集，也可以给与b对应的其他向量取子集。

840 0

生信马拉松 Day7

(test, new = Sepal.Length * Sepal.Width) #没赋值的情况下数据实际是不会新增的 #新增列名为new，值为Sepal.Length * Sepal.Width的一列...，不可以是多个逻辑值组成的向量 } #if+else的格式 if (){ }else{ } #ifelse的格式 ifelse( , ,) #第一个逗号前是逻辑值 #for的格式 for(){...(dplyr) i = 0 ifelse(i>0,"+",ifelse(i<0,"-","0")) case_when(i>0 ~ "+", i<0 ~ "-",...…) #其中X是数据框/矩阵名； #MARGIN为1表示行，为2表示列，FUN是函数 test<- iris[1:6,1:4] apply(test, 2, mean) #对列操作，得到有names...2种方法 2.如何把数据框某列的“ ”转换为NA iris$Species[iris$Species=='']=NA 3.如何删除多余的信息 #这里示例数据中，a$tumor_stage.diagnoses

2400 0

R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)

包 #dplyr中基本函数 filter——数据筛选（筛选观测值，行） filter(Hdma_dat,pclass == 1) ###################################...## #dplyr中基本函数 select——子集选取（筛选变量，列） select(Hdma_dat,pclass,survived) ##选择pclass变量 ?...可以看到，计算结果中的第一列实际上是“SELLERID.CLIENT”，我们需要把它拆分成两列并调换顺序才行。...(iris$setosa)] #按照照setosa的大小，重排Sepal.Length数据列四、dplyr与data.table data.table可是比dplyr以及python中的...data.table包提供了一个非常简洁的通用格式：DT[i,j,by]，可以理解为：对于数据集DT，选取子集行i,通过by分组计算j。

20.7K3 2

R&Python Data Science 系列：数据处理（2）

2 条件函数这里介绍3个条件函数，if_else()、case_when()、between()函数，Python包dfply和R包dplyr中都是这3个函数，在用法上有点细微差别，日常中使用最多...而且if_else()函数可以嵌套使用，不过当条件判断超过2个的时候，建议使用case_when()函数。...注意：python在jupyter中使用管道函数换行书写代码的时候需要用()把代码括起来。 2.2 case_when函数用于多条件赋值，评分卡Woe赋值的时候使用起来很方便。...注意：case_when函数在Python和R语言中使用的时候有点区别，请留意。...注意：R语言中可以使用XXX_join(a，b，by)，Python中不可以使用。

7611 0

生信入门马拉松之R语言基础-脚本项目管理、条件循环、表达矩阵和一丢丢数据挖掘(Day 7)

undefined表格文件需要赋值，读取参数不同导致读取结果不同，不能在后续代码中同等处理。Rdata可以保存多个变量，下次使用只需要一次load可以的到多个数据。...代码2实现结果和代码1相同2.6 练习library(dplyr)x = c(-1,-1,4,5,2,0)case_when(x>0 ~ "A", x==0 ~ "0",...表达矩阵需要变化3.2.1 初始的表达矩阵：3.2.2 转置（行变列，列变行）3.2.3 把原来的行名变成第一列3.2.4 变形（宽变长）一定要先单独学会某个包/函数，才能应用它吗？不一定！...表达矩阵：一行是一个基因在所有样品里的表达，一列是一个样本里所有基因的表达。在表达矩阵中，寻找在不同组有表达差异的基因。...7.5.3 箱线图的应用单个基因在两组之间表达量的差异可视化。分组信息：是一个有重复值的离散型的向量，分组向量的元素和表达矩阵的列是一一对应的。

1510 0

从零开始的异世界生信学习 R语言部分 06 R应用专题

，生成与向量元素相等的逻辑值向量，可以用来取子集 str_starts(x2,"T") ##检测是否以T开头 str_ends(x2,"e") ##检测是否以e结尾图片 5. str_replace...list，使用下标循环，可以将每次循环的结果都保存到列表中 ## cbind 按列拼接 a = rnorm(10) b = 1:10 cbind(a,b) ##do.call() 函数是对列表 list..."), ##选择那几列的列名合成在一起组成新的一列 names_to = "gene", ##新的列的名字 values_to = "count...") ## 把原来列中的数值一一对应形成一个新的数值列'count' 图片 library(ggplot2) p = ggplot(pdat,aes(gene,count))+ geom_boxplot...），右表中多余的数据舍去，没有的数据显示缺失值 right_join(test1,test2,by="name") ##右连接，以右侧的表的行为准构成新的数据框（第二个写的数据框），左表中多余的数据舍去

2.5K3 0

2023.4生信马拉松day7-R语言综合应用

-（2）列表使用不方便——simplify = T简化结果，简化成矩阵 -（3）注意：之前提到过，矩阵的某一列不能单独转换数据类型，需要把矩阵转换成数据框再转换某列的数据类型；或者把这列单独提取出来再转换其数据类型...； -（2）判断之后得到一个与x2相等的逻辑值向量； -（3）可以用来做“根据逻辑值提取x的子集”； str_detect(x2,"h") #判断x的每个字符串含不含有某个字母或者多个字母的组合； str_starts...：不符合大于零的条件，就再进行一步判断；练习7-2 # 1.加载deg.Rdata,根据a、b两列的值，按照以下条件生成向量x： #a< -1 且b<0.05,则x对应的值为down； #a>1 且b...转换数据：把表格转换成两列数据 -（1）第一步：转置 -（2）第二步：把行名作为一列添加到数据中（因为ggplot2容易把行名丢掉，所以倾向于把行名作为一列） -（3）第三步：新增一列“group...gene", #新的列名叫gene values_to = "count") #由原来的值转换得到的那一列的列名叫count 图片 2.

3.6K8 0

数据处理第2节：将列转换为正确的形状

转换列：基础部分您可以使用mutate（）函数创建新列。 mutate中的选项几乎是无穷无尽的：你可以对普通向量做任何事情，可以在mutate（）函数内完成。...mutate中的任何内容都可以是新列（通过赋予mutate新的列名），或者可以替换当前列（通过保持相同的列名）。最简单的选项之一是基于其他列中的值的计算。...通过使用mutate_at（），我们在管道中需要两个参数：首先，它需要有关列的信息。...如果我想在几分钟内完成，我可以使用mutate_at（）并将包含列的所有'sleep'包装在vars（）中。其次，我在飞行中创建一个函数，将每个值乘以60。...如果要添加另一个数据框的信息，可以使用dplyr中的连接函数。

8.1K3 0

RNA-seq 保姆教程：差异表达分析（二）

导入表达矩阵开始导入文件夹中的 featureCounts 表。本教程将使用 DESeq2 对样本组之间进行归一化和执行统计分析。...DESeq2对象根据计数和元数据创建 DESeq2 对象 # - countData : 基于表达矩阵 # - colData : 见上图 # - design : 比较 ddsMat <- DESeqDataSetFromMatrix...统计获取基因数量的基本统计数据 # 使用 FDR 调整 p-values 从检测中获取结果 results <- results(ddsMat, pAdjustMethod = "fdr", alpha...通路富集从差异表达基因中寻找通路通路富集分析是基于单个基因变化生成结论的好方法。有时个体基因的变化是难以解释。但是通过分析基因的通路，我们可以收集基因反应的视图。...) == FALSE) # 创建一个log2倍数变化的基因矩阵 gene_matrix <- results_sig_entrez$log2FoldChange # 添加 entrezID 作为每个

8643 0

R tips：使用TCGAbiolinks包下载TCGA数据

GDCdownload，由于TCGA的下载不是特别稳定，所以可以使用files.per.chunk定为一个值，几个文件打包为一个压缩文件来下载。...这个过程中，GDCprepare还会将生存数据自动合并到summarizedExperiment对象的colData中。...表达量：一个表达量矩阵，行是基因或者相关特征，列是样本或相关特征; 列注释：样本相关的注释，比如病人信息、生存数据等等；行注释：基因相关的注释，比如基因名称、长度、位置、ID等等。...Normalization需要控制的三个不均衡因素是文库大小、基因长度及文库组成：文库大小：比如样本A是样本B的测序量的两倍，那么在同等表达水平下，样本A的基因的Counts值就是B的两倍；基因长度...生存分析时根据基因的中位数将其分为High和Low，使用log-rank检验显著性，也可以使用cox回归。

3.1K3 1

R语言数据框、矩阵、列表的创建、修改、导出

数据框数据框的创建数据框来源主要包括用代码新建(data.frame)，由已有数据转换或处理得到(取子集、运算、合并等操作)，读取表格文件(read.csv,read.table等)及R语言内置数据函数...merge函数可连接两个数据框，通过指定公共列使具有相同元素的行的列合并*merge函数可支持更复杂的连接，但通过inner_join等更为简便，后述test1 <- data.frame(name =...#取子集方法同数据框t(m) #转置行与列，数据框转置后为矩阵as.data.frame(m) #将矩阵转换为数据框列表列表内有多个数据框或矩阵，可通过list函数将其组成一个列表l <- list(m1...3.筛选test中，Species列的值为a或c的行test[test$Species %in% c("a","c"),]#注意本题至少有三个问题，第一是值a，c为字符型，要加""，第二是向量是c()不是...="y.Rdata")class(y)# $不支持矩阵，因此不能在这里使用class(y[,1])mean(as.numeric(y[,1]))#矩阵只允许一种数据类型，单独更改一列的数据类型没有意义，

7.7K0 0

R语言数据集合并、数据增减、不等长合并

merge 按照指定列合并矩阵或者数据框一、数据合并 1、merge()函数最常用merge()函数，但是这个函数使用时候这两种情况需要注意： 1、merge(a,b)，纯粹地把两个数据集合在一起...2、dplyr包 dplyr包的数据合并，一般用left_join(x,y,by="name") 以x为主，y中匹配到的都放进来，但，y中没有的则不放过来。...（RODBC、sqldf包）二、数据增减 x=x[,-1] #这个就代表，删除了x数据集中第一列数据或用dplyr包中的mutate函数 a=mutate(Hdma_dat,dou=2*survived...,dou4=4*survived) Hdma_dat$dou=a$dou Hdma_dat$dou4=a$dou4 #两个新序列，加入到Hdma数据集汇总筛选变量服从某值的子集 subset(airquality...rowSums函数对行求和，使用colSums函数对列求和。

13.2K1 2

十二、R语言的综合应用

1.转置t 2.把原来的行名变成第一列 3.宽变长 4.画图 # 表达矩阵 set.seed(10086) ###目的是为了使后边rnorm的值变得固定 exp = matrix...2, mean) ### 对test的这个矩阵的每一列求平均值 apply(test, 1, sum) ### 对test的这个矩阵的每一行求和 # 如何挑出100个数字中最大的10个？...# 对列表/向量中的每个元素（向量）实施相同的操作 test <- list(x = 36:33,y = 32:35,z = 30:27);test #返回值是列表，对列表中的每个元素（向量）求均值(...，取右边表中存在的子集 anti_join(test1,test2,by="name") ###反连接，左边表里在右边表里没有的会被留下来。...#是b的下标，可以给b取子集，也可以给与b对应的其他向量取子集。

3.1K3 0

生信代码：数据处理（ tidyverse包）

在Rstudio中加载tidyverse包，可以看到该包下有8个子包，著名的ggplot2包即是其中的一个子集，我们先着重讲一下数据处理有关的包——dplyr包。...dplyr包下主要是以下几个操作: select()——选择列 filter/slice()——筛选行 arrange()——对行进行排序 mutate()——修改列/创建列 summarize(...1 mutate() mutate（）与基础函数transform（）相似，都可以添加新的一列，但是允许引用刚刚创建的列： mydata <- tibble(x1=c(2,2,6,4),...，如果后续要使用到，需要保存下来 5 arrange() R base包中涉及到排序的包括 sort()，rank()，order()，而在dplyr包中与排序相关的是arrange()包，默认是从高到低进行排序...，我们如果对个人或者科目感兴趣的话，可以使用group_by（name或者type），然后利用summarize函数就可以求出分类之后的各个统计值。

2K1 0

「Workshop」第二期：程序控制与数据操作流

num_range starts_with ends_with one_of matches 行筛选 slice, filter, sample_n, sample_frac, top_n, distinct 列筛选...select 排序 arrange 行列增加/更新基本的数学和比较逻辑运算符 + - * / > < == 偏移 dplyr:: lag lead 聚合 dplyr:: cumall cumany...其他 dplyr:: between case_when coalesce if_else na_if pmax pmin recode recode_factor mutate, transmute...is.na()) 位置 mean, meadian 逻辑值 mean, sum 位置 dplyr:: first last nth 排序 quantile min max 分布 IQR mad sd var...write_* data.table 与 base 数据导入 fread 数据导出 fwrite data.table 语法 dt[i, j, by] 数据过滤与合并等操作与 R 基础语法一致，也可以使用

1.6K3 0

R 数据整理（七：使用tidyr和dplyr处理数据框 2.0）

，后续的参数是条件，这些条件是需要同时满足的，另外，条件中取缺失值的观测自动放弃，这一点与直接在数据框的行下标中用逻辑下标有所不同，逻辑下标中有缺失值会在结果中产生缺失值。...dplyr 包的 distinct() 函数可以对数据框指定若干变量，然后筛选出所有不同值，每组不同值仅保留一行。...2.10 表格的拆分与合并将同一列中的内容分为两列内容。或将两列内容合并为同一列内容。首先还是可以创建一个数据框。...对于待分离的对象（col），不必加上引号；但对于即将创建的新列（into），需要使用引号，由于是两列，这里使用向量创建。sep参数设定读取表格信息时以何符号作为分隔符。...对于即将合并的新列，需要使用引号；但对于想要合并的多个列名，可以不用使用引号。sep 参数设定多列合并后不同数据分隔使用的分割符。

10.8K3 0

生信学习-Day6-学习R包

逗号之后的空位表示选择这些行的所有列（即所有的特征和标签）。 test <-: 这是赋值操作，它会将选择的子集保存到一个新的变量 test 中。...综上所述，这行代码的作用是创建一个新的数据框 test，它包含了 iris 数据集中的第1、2、51、52、101、102行. 4 五个基础函数 1.新增列：mutate() 2.选择列（按列筛选）列号...在dplyr包的filter()函数中使用时，它可以用于筛选数据框中匹配给定集合中任一值的行。这行代码的作用如下： filter(test, ...): 在test数据框中筛选行。...执行这个操作后，你将得到一个新的数据框，其中只包含test数据框中Species列值为"setosa"或"versicolor"的行。...group_by(Species)：这一步将数据按照Species列的不同值进行分组，即将数据集分成多个子集，每个子集包含相同Species值的数据。

1821 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭