展开

关键词

R语言中这个筛选差异基因的方式可读性很好,值得推荐

"NoDiff")) dplyr::case-when 标记差异基因 比之前简洁了一些,可读性强 library(dplyr) res_output %>% mutate(level = case_when groupB,"UP"), "NoDiff"))) case-when只保留差异基因的名字 library(dplyr) res_output %>% mutate(diff_gene = case_when 临时生成列时操作起来更方便了 library(dplyr) res_output %>% mutate(rank=1:n(), keep_gene = case_when suppressPackageStartupMessages(library(tidyverse)) microbenchmark::microbenchmark( case_when(1:1000 Unit: microseconds #> expr min lq mean #> case_when

12430

R&Python Data Science 系列:数据处理(2)

2 条件函数 这里介绍3个条件函数,if_else()、case_when()、between()函数,Python包dfply和R包dplyr中都是这3个函数,在用法上有点细微差别,日常中使用最多 而且if_else()函数可以嵌套使用,不过当条件判断超过2个的时候,建议使用case_when()函数。 2.2 case_when函数 用于多条件赋值,评分卡Woe赋值的时候使用起来很方便。 R语言实现 ##如果钻石价格大于2000,则钻石等级为A,1500-2000为B, 1000-1500以下为C,1000以下为D diamonds %>% mutate(price_class = case_when 注意:case_when函数在Python和R语言中使用的时候有点区别,请留意。

28910
  • 广告
    关闭

    一大波轻量级工具升级重磅来袭

    代码传递思想,技术创造回响!Techo Day热忱欢迎每一位开发者的参与!

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    用R根据logFC和p值批量标注基因上下调的N种方法

    "10"="none") df$method3 <- lookup[as.character(df$regulation)] head(df) 第四种方法:逻辑判断转为数字1和0,然后用dplyr包的case_when df$method4 <- case_when(df$regulation == 2 ~ "up", df$regulation == 11 ~ "down test_p & test_up, "up", ifelse(test_p & test_down, "down","none")) 第六种方法:dplyr的case_when df$method6 <- case_when(test_p & test_up ~ "up", test_p & test_down ~ "down", !

    2.5K10

    如何自定义Y轴间隔(制作类似fox news的线图)

    scales::trans_new("crazyfox", transform = function(y){ yt <- case_when return(yt) }, inverse = function(yt){ y <- case_when

    18210

    R语言ggplot2:单元格为方块的热图简单小例子-2

    image.png 构造数据 library(dplyr) df1%>% mutate(group_1 = case_when( value <= 0 ~ "A", TRUE ~ " B" ))%>% mutate(group_2=case_when( value >= -1 & value < -0.7 ~ "[-1,-0.7)", value >= -0.7 0.5 & value <= 0.7 ~ "(0.5,0.7]", value > 0.7 & value <= 1 ~ "(0.7,1]", ))%>% mutate(value_1=case_when

    63320

    跟着Nature Microbiology学作图:R语言ggplot2做黑白格的热图

    levels = rev(colnames(df)[3:16])) dfa$value<-as.character(dfa$value) dfa %>% mutate(new_col=case_when

    14430

    tidyr包数据清理

    0.00813 # ... with 1,268 more rows * * * 3.根据Sample列生成新列 family_data <- family_data %>% mutate(Group = case_when , startsWith(Sample, "Bd-2") ~ "Second ", startsWith(Sample, "Bd-3") ~ "Third "), num = case_when

    6145

    我发现了pandas的黄金搭档!

    also( lambda df: print(f"字段名:{df.columns.tolist()}") ) .drop(columns='b') ) df 2.2 利用case_when ()方法实现多条件分支 pyjanitor中的case_when()方法可以帮助我们针对数据框实现类似SQL中的的多条件分支运算,注意,因为是多条件分支,所以包含最后的“其他”条件在内,需要至少定义3条分支规则

    6920

    (数据科学学习手札134)pyjanitor:为pandas补充更多功能

    also( lambda df: print(f"字段名:{df.columns.tolist()}") ) .drop(columns='b') ) df 2.2 利用case_when ()方法实现多条件分支 pyjanitor中的case_when()方法可以帮助我们针对数据框实现类似SQL中的的多条件分支运算,注意,因为是多条件分支,所以包含最后的“其他”条件在内,需要至少定义3

    7520

    使用 ncov 包获取并分析疫情数据

    10~99人", "100~999人", "1000~10000人", "> 10000人") ), value = as.character(value), value = case_when id" = "id")) %>% select(name = name.y) %>% left_join(df$othercountry) %>% mutate( value = case_when "10~49人", "50~99人", "100~1000人", "> 1000人") ) %>% as.character() ) %>% mutate( value = case_when

    33020

    R语言ggplot2画漂亮的环形柱形图的一个实例

    group_by(attribute) %>% mutate(attribute = str_remove(attribute, " Level"), attribute = case_when (value)) %>% mutate(id = row_number()) %>% ungroup() %>% #2 Pissaro #1 Signac mutate(fill = case_when

    15130

    70-R茶话会15-你的编程菜鸟路上缺失的一课

    1-switch和case_when 在做数据分析时,常常遇到的一个场景是,1,2,3 需要转换成其对应的"a","b","c"。比如在对结果进行分类统计的时候。 2 3 3 3 3 1 1 1 2 2 2 2 3 2 1 1 但这样的循环编程语法是低效的,dplyr 提供了向量化的操作[[37-R茶话会07-高效的处理数据框的列]]: > dplyr::case_when

    13240

    数据处理第2节:将列转换为正确的形状

    3.00 short ## # ... with 73 more rows 创建新的离散列(多个级别) ifelse()可以嵌套,但如果你想要两个以上的级别,但是使用case_when 不幸的是,似乎没有简单的方法让case_when()返回一个有序的因子,所以你需要自己做,之后使用forcats :: fct_relevel(),或者只是一个因子()函数。 msleep %>% select(name, sleep_total) %>% mutate(sleep_total_discr = case_when( sleep_total > ## 10 Roe deer 3.00 short ## # ... with 73 more rows case_when ()函数不仅可以在单独列工作,还可以用于跨列分组: msleep %>% mutate(silly_groups = case_when( brainwt < 0.001 ~ "light_headed

    33130

    「Workshop」第二期:程序控制与数据操作流

    cumprod cumsum 排序 dplyr:: cume_dist dense_rank min_rank ntile percent_rank row_number 其他 dplyr:: between case_when

    20030

    跟着Science学画图:R语言ggplot2作热图展示基因存在缺失变异(PAV)

    .)) %>% select(2:27,x) %>% reshape2::melt(,id.vars="x") %>% mutate(pav=case_when( value

    34830

    嫌 pandas 的方法不够简洁方便,那你一定是没有使用它的增强库

    ---- pyjanitor 的 case_when 代码来自于官网 结果是对了,但是感觉 case when 方法里面的东西很乱呀 我来标注一下: 红色框是条件,绿色框是返回值 但是,我们不是一定要使用

    8820

    跟着Cell学作图:R语言ggplot2做散点图并添加拟合曲线和文字标签

    ,V6) %>% group_by(V1,V2) %>% summarise(V5=mean(V5), V6=mean(V6)) %>% mutate(V3=case_when

    50820

    表型数据和基因型数据--聚类分析

    fill=F)+ theme_bw() # 主题 # 绘制3-D PCA图 library(scatterplot3d) pca_re2 = pca_re2 %>% mutate(colour = case_when

    10220

    跟着Forest Ecol Mang学作图:R语言ggplot2作图展示相关性分析结果

    rowname) %>% mutate(p_value=case_when( value > 0.05 ~ "A", value >0.01 & value <= 0.05 ~ "

    24720

    答读者问:R语言ggplot2画气泡图展示相关性分析的结果~文末留言送书

    第一步树读入数据 df<-read.csv("20210320.csv",header=T) head(df) 增加一列显著性的星号 library(dplyr) df%>% mutate(label=case_when

    90920

    扫码关注云+社区

    领取腾讯云代金券