首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

「R」dplyr 列式计算

❝在近期使用 「dplyr」 进行多列选择性操作,如 mutate_at() 时,发现文档提示一系列的 「dplyr」 函数变体已经过期,看来后续要退休了,使用 across() 是它们的统一替代品,所以最近抽时间针对性的学习和翻译下...原文来自 [dplyr 文档](Column-wise operations • dplyr (tidyverse.org "dplyr 文档")) - 2021-01❞ 同时对数据框的多列执行相同的函数操作经常有用...(如果你想要计算每一行 a, b, c, d 的均值,请看行式计算一文) 本文将向你介绍 across() 函数,它可以帮助你以更加简洁的方式重写上述代码: df %>% group_by(g1,...这使 「dplyr」 更容易使用(因为需要记住的函数更少),也使我们更容易实现新的动词(因为我们只需要实现一个函数,而不是四个)。..._at() 函数是 「dplyr」 中唯一你需要手动引用变量名的地方,这让它们比较奇怪且难以记忆。 为什么过了这么久才发现 across()?

2.4K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    R语言之 dplyr 包

    这个包以一种统一的规范更高效地处理数据框。dplyr 包里处理数据框的所有函数的第一个参数都是数据框名。 下面以 MASS 包里的 birthwt 数据集为例,介绍 dplyr 包里常用函数的用法。...select(birthwt, bwt, age, race, smoke) 请注意,MASS 包里有一个同名函数 select( ),如果同时加载了 dplyr 包和 MASS 包,R 会默认使用较后加载的包里的函数...4.使用 mutate( ) 添加新变量 函数 mutate( ) 用于在数据框中创建新的变量。...# 当然如果想要用新变量替换原来的变量,只需把新变量命名为原来的变量名: mutate(birthwt, lwt.kg = lwt*0.4536) 5.使用 summarise( ) 计算统计量 函数...| ht > 300, NA, ht) # 将变量ht中的0和大于300的值变成NA; )

    44920

    1.javascript中的函数

    函数是指能完成特定功能的代码段; 2、函数的声明 函数是由这样的方式进行声明的:关键字 function、函数名、一组参数(根据需要使用参数),以及置于括号中的待执行代码(功能),返回值(可选)。...name); } 3、函数的调用 函数可以通过其名字加上括号中的参数进行调用,如果有多个参数。...如果您想调用上例中的那个函数,可以使用如下的代码: (1)sayHello("joshua"); (2)var sayHi = sayHello; sayHi('joshua'); 函数名不加...要实现这一点,必须用较大的数减去较小的数,因此用 if 语句决定执行哪个 return 语句。 如果函数无返回值,那么可以调用没有参数的 return 运算符,随时退出函数。...注释:如果函数无明确的返回值,或调用了没有参数的 return 语句,那么它真正返回的值是 undefined。

    50110

    2021-05-19:给定一个非负数组成的数组,长度一定大于1

    2021-05-19:给定一个非负数组成的数组,长度一定大于1,想知道数组中哪两个数&的结果最大。返回这个最大结果。时间复杂度O(N),额外空间复杂度O(1)。...福大大 答案2021-05-19: 因为是正数,所以不用考虑符号位(31位) 首先来到30位,假设剩余的数字有N个(整体),看看这一位是1的数,有几个 如果有0个、或者1个 说明不管怎么在数组中选择,任何两个数...&的结果在第30位上都不可能有1了 答案在第30位上的状态一定是0, 保留剩余的N个数,继续考察第29位,谁也不淘汰(因为谁也不行,干脆接受30位上没有1的事实) 如果有2个, 说明答案就是这两个数(直接返回答案...现在来到i位,假设剩余的数字有M个,看看这一位是1的数,有几个 如果有0个、或者1个 说明不管怎么在M个数中选择,任何两个数&的结果在第i位上都不可能有1了 答案在第i位上的状态一定是0, 保留剩余的M...个数,继续考察第i-1位 如果有2个, 说明答案就是这两个数(直接返回答案),因为别的数在第i位都没有1,就这两个数有。

    31810

    Day6——R包

    BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") install.packages("dplyr")library(dplyr)dplyr五个基础函数示例数据...每个花的特征用下面的5种属性描述萼片长度(Sepal.Length)、萼片宽度(Sepal.Width)、花瓣长度(Petal.Length)、花瓣宽度(Petal.Width)、类(Species)。...one_of函数R语言中使用vars参数指定数据框中需要分析的字段索引范围在R语言中,我们经常需要对数据框进行分析和处理。...这时,我们可以使用vars参数来指定需要分析的字段索引范围,从而提取出感兴趣的字段进行后续操作。vars参数是dply包中select函数的一个参数,它允许我们通过指定字段的索引范围来选择需要的字段。...值计数函数计算数据集中列唯一值的数量count(test,Species)## Species n##1 setosa 2##2 versicolor 2##3 virginica 2dplyr

    15910

    如果简化stm32中printf函数的使用——首先重定向

    STM32单片机极简方法 使用宏定义 代替复杂的重定向printf()函数,实现串口打印。...首先在stm32中添加SWO输出功能,在uart.c中添加如下代码,作为printf的重定向。...PUTCHAR_PROTOTYPE { RS485PA8_TX; HAL_UART_Transmit(&huart1, (uint8_t *)&ch, 1, HAL_MAX_DELAY...具体怎么实现SWO功能可以参考strongerHuang博客的教程,这里不予重复。我在另外的文章也提到过了。 第二新建 debug.h,文件名都可以自定义的,不局限的,然后在c文件添加该头文件。...第三,使用方式更加简洁 _MSG_DBG("i=%u\n", i++); 和printf函数一模一样,只是换了一个名称罢了。这种方法可以省去每添加一个printf都需要这么写,很费时费力。

    1.4K30

    R tips:使用TCGAbiolinks包下载TCGA数据

    另外如果这里的下载如果不成功的话,需要重复运行几次,直至完全下载成功。...这个过程中,GDCprepare还会将生存数据自动合并到summarizedExperiment对象的colData中。...Normalization需要控制的三个不均衡因素是文库大小、基因长度及文库组成: 文库大小:比如样本A是样本B的测序量的两倍,那么在同等表达水平下,样本A的基因的Counts值就是B的两倍; 基因长度...:如果需要进行Gene间的比较,那么需要对基因长度做Normalization,否则的话,基因越长,获得的基因Counts也就越多; 文库组成:比如样本A是敲除样本,而样本B是过表达样本,那么这个时候我们就不能假定两个样本的转录组总表达量是一致的...== "Primary Tumor") %>% mutate(status = ifelse(vital_status == 'Dead', "1", "0")) %>% mutate(

    3.4K31

    「R」数据操作(七):dplyr 操作变量与汇总

    使用mutate()添加新变量 除了选择已存在的列,另一个常见的操作是添加新的列。这就是mutate()函数的工作了。 mutate()函数通常将新增变量放在数据集的最后面。...这些函数的一个关键属性就是向量化的:它必须使用一组向量值作为输入,然后返回相同长度的数值作为输出。我们没有办法将所有的函数都列举出来,这里选择一些被频繁使用的函数。...算术操作符 算术操作符本质都是向量化的函数,遵循“循环补齐”的规则。如果一个参数比另一个参数短,它会自动扩展为后者同样的长度。比如air_time / 60,hours * 60等等。...有用的汇总函数 仅仅使用均值、计数和求和这些函数就可以帮我做很多事情,但R提供了许多其他有用的汇总函数: 位置度量 我们已经使用过mean()函数求取平均值(总和除以长度),median()函数也非常有用...比如,quantile(x, 0.25)会找到x中刚好大于25%的值而小于7%的值的那个数。 # 每天第一班飞机和最后一般飞机是什么时候?

    2.6K20

    R语言数据集合并、数据增减、不等长合并

    ,没有沟通a、b数据集的by,这样出现的数据很多,相当于a*b条数据; 2、merge函数是匹配到a,b数据集的并,都有的才匹配出来,如果a、b数据集ID不同,要用all=T(下面有all用法的代码)。...=T代表右连接 2、dplyr包 dplyr包的数据合并, 一般用left_join(x,y,by="name") 以x为主,y中匹配到的都放进来, 但,y中没有的则不放过来。...3、paste函数 生成一长串字符向量。 paste(c("X","Y"),1:10,sep="") #"X”,"Y"是长度为2的字符向量,1:10 长度为10的向量。...(RODBC、sqldf包) 二、数据增减 x=x[,-1] #这个就代表,删除了x数据集中第一列数据 或用dplyr包中的mutate函数 a=mutate(Hdma_dat,dou=2*survived...#do.call函数在数据框中执行函数(函数,数据列) library("plyr") #加载获取rbind.fill函数 #第一种方法 list1<-list() list1[[1]]=data.frame

    13.6K12

    生信技能树- R语言-day7

    玩转字符串1.检测字符串长度str_length(x)length(x)# 字符的个数2.字符串拆分str_split(x," ") # 把42个字符 按照“空格”拆分成八个字符串class(str_split...duplicated(mm)] 提取没有重复的第一次出现的mutate,数据框新增一列mutate(test, new = Sepal.Length * Sepal.Width) new是新产生的列名新加之后...9.5 9.4 9.4 10.2 11.4 思考题:如何挑出30个数里最大的5个head 取头几个tail 取尾巴的几个还没做思考题:如何跳出一个表达矩阵里方差最大的1000个基因思考题:取出大于...1的所有行向量/列表的隐式循环-lapplylapply(list, FUN, …)对列表/向量中的每个元素实施相同的操作lapply(1:4,rnorm)两个数据框的链接merge可以合并inner_join...("douhua",1:100,".txt")file.create(f)file.remove(f)重要的函数多脚本的管理便于方面管理的文件夹save(赋值各个文件名,file = "xxxx.Rdata

    10400

    来增加dplyr的可操作性

    执行expression(语句)即可获得结果,执行在R中叫做evaluation。 上述过程中,baseR中的函数parse可以进行解析工作,函数eval可以进行执行工作。...一个代码在R console中是直接运行到结束的,如果想要获得其中间态:语句,可以使用expr函数来捕获它。...下面完成的上述操作的所需的函数都是rlang包中相应函数。 如何使用!!...辅助dplyr完成编程工作 上面的例子中,之所以group_var不起作用,是因为dplyr直接将group_var当做变量名,然后去mtcars中寻找名字叫做group_var的列,这肯定是会报错的。...1 2 上述虽然可以完成,但是实际使用时,可能更倾向于将四个新变量放置到同一个数据框中,可以如下操作: ### 添加新列的函数 mutate_news <- function(.data,

    2.5K31
    领券