前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >39. R 数据整理(十: R 的四种累积运算与by)

39. R 数据整理(十: R 的四种累积运算与by)

作者头像
北野茶缸子
发布于 2021-12-17 01:24:22
发布于 2021-12-17 01:24:22
60900
代码可运行
举报
运行总次数:0
代码可运行
  • cumsum 可以实现整体的累加
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
> cumsum(1:10)
 [1]  1  3  6 10 15 21 28 36 45 55

向量中第一个元素为起始,后面是其需要加的数。

  • cumprod(x) 累乘
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
> cumprod(1:5)
[1]   1   2   6  24 120
  • cummax 保留出现的最大的那个数,并不断输出
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
> cummax(c(3:1, 2:0, 4:2))
[1] 3 3 3 3 3 3 4 4 4
  • cummin 同理最小的那个
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
> cummin(c(3:1, 2:0, 4:2))
[1] 3 2 1 1 1 0 0 0 0

总结一下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Returns a vector whose elements are the cumulative sums, products, minima or maxima of the elements of the argument.

Usage
cumsum(x)
cumprod(x)
cummax(x)
cummin(x)

by

使用by()分组计算描述性统计量,它可以一次返回若干个统计量。格式为:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
by(data, INDICES, FUN)

其中data是一个数据框或矩阵;INDICES是一个因子或因子组成的列表,定义了分组;FUN是任意函数。

通过INDICES 定义的因子,对data 内容进行分组,即将整个data大数据框,划分为了若干个小的数据框,而函数则定义了对这些分组数据处理的方式。

例子

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
tmp = by(exp,
         ids$symbol,
         function(x) rownames(x)[which.max(rowMeans(x))])

这里面,exp 为原有的数据框,而ids$symbol 则是区分exp 信息的向量,其将exp 按照symbol 中的信息划分为若干个矩阵,而function 则定义了在同一组(同一symbol)中的列名筛选其中平均值最大的那一列( which.max(rowMeans(x)) )。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-10-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 北野茶缸子 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
R语言的常用函数速查
一、基本 1.数据管理 vector:向量 numeric:数值型向量 logical:逻辑型向量character;字符型向量 list:列表 data.frame:数据框c:连接为向量或列表 length:求长度 subset:求子集seq,from:to,sequence:等差序列rep:重复 NA:缺失值 NULL:空对象sort,order,unique,rev:排序unlist:展平列表attr,attributes:对象属性mode,typeof:对象存储模式与类型names:对象的名字属
钱塘数据
2018/03/01
2.7K0
R in action读书笔记(5)-第七章:基本统计分析
mpg hp wt
统计学家
2019/04/10
5550
26. R 数据整理(一:base R 的数据处理函数)
对一个数据框 d,用 summary(d) 可以获得每个连续型变量的基本统计量,和每个离散取值变量的频率。以及分类变量的各种类型的统计结果。如:
北野茶缸子
2021/12/17
9370
26. R 数据整理(一:base R 的数据处理函数)
生信入门马拉松之R语言基础-脚本项目管理、条件循环、表达矩阵和一丢丢数据挖掘(Day 7)
数据框函数- 排序arrange()和desc参数、distinct()去重复、mutate()数据框新增列
Crazy_George
2024/04/17
2151
左手用R右手Python系列之——数据框与apply向量运算
R语言与Python中的apply函数都有着丰富的应用场景,恰到好处的使用apply函数,可以避免在很多场景下书写冗余的代码,这不仅能提高代码可读性,而且提高代码执行的效率。 apply(X, MARGIN, FUN, ...) X #一个数组(包括矩阵) MARGIN #一个给定下标的向量,将被指定函数执行计算1代表行,2代表列,c(1,2)代表行列。 FUN #执行计算的函数(如果是+、%*%这种符号函数需要使用反引号包括【英文输入法状态下的“~”键】) ... #
数据小磨坊
2018/04/12
2K0
【基础】R语言2:数据结构
第一自变量h与与第二自变量sex是等长的, 对应元素分别为同一人的身高和性别, tapply()函数分男女两组计算了身高平均值
锂电池
2024/04/07
1180
分组计算描述性统计量函数—by()函数
简单点说by(data, INDICES, FUN)函数的典型用法: 是将data数据框或矩阵按照INDICES因子水平进行分组,然后对每组应用FUN函数。 是不是没懂?反正看完后我没懂~
生信技能树
2019/05/24
1.1K0
R语言统计相关函数总结
R 语言在统计分析方面起了很大的作用,并且其开开放性更是促进了大量分析R包的出现。今天我们就不一一去列举相关的R包,而是总结一下R语言自带的统计学函数。 一、统计学数据的生成函数: norm 正态分布 f F分布 unif 均匀分布 cauchy 柯西分布 binom 二项分布 geom 几何分布 diag 对角阵 二、基础的运算函数 abs 绝对值 sqrt 平方根 exp e^x次方 log 自然对数 log2,log10 其他对数 sin,cos,tan 三角函数 sinh,cosh,tanh 双曲
一粒沙
2019/07/31
1.1K0
GEO数据挖掘-基于芯片
在require()函数中,如果直接传递包的名称作为参数,不需要加引号;如果包的名称以字符串形式存储在变量中,则需要使用character.only = TRUE来指定这个变量是一个字符串
sheldor没耳朵
2024/07/23
2150
GEO数据挖掘-基于芯片
R语言 常见函数知识点梳理与解析 | 精选分析
R语言 控制流:for、while、ifelse和自定义函数function|第5讲
1480
2019/07/22
2.4K0
R语言 常见函数知识点梳理与解析 | 精选分析
35. R 数据整理(七:使用tidyr和dplyr处理数据框 2.0)
假设数据以 tibble 格式保存。数据集如果用于统计与绘图,需要满足一定的格式要求,(Wickham, 2014) 称之为 整洁数据 (tidy data),基本要求是每行一个观测,每列一个变量,每个单元格恰好有一个数据值。这些变量应该是真正的属性,而不是同一属性在不同年、月等时间的值分别放到单独的列。
北野茶缸子
2021/12/17
11K0
35. R 数据整理(七:使用tidyr和dplyr处理数据框 2.0)
34. R 数据整理(六:根据分类新增列的种种方法 1.0)
通过 gather ,并设定key(原先的列),与value(原先的数据),并通过 - (原先的行),对数据框进行转换。
北野茶缸子
2021/12/17
2.1K0
34. R 数据整理(六:根据分类新增列的种种方法 1.0)
GEO数据挖掘
箱型图不显示原始数据点,而是采用样本数据,根据四分位数用盒和线来显示值的范围。此外,它们用星号显示落在箱须之外的离群值
可乐同学与生信死磕到底
2024/04/08
1930
「R」基本统计分析
因为书中列举的方法和知识点比较多,没必要全都掌握,会一种,其他的了解即可。我就简要地整理一下我觉得重要的吧。
王诗翔呀
2020/07/06
1.6K0
GEO数据库中芯片数据分析思路
AnnoProbe是曾建明老师2020年开发的一款用于下载GEO数据集并注释的R包,收录在tinyarray里。 idmap##根据所给的GPL号,返回探针的注释 geoChina##根据所给的GSE号,下载对应的表达矩阵 annoGene##根据gencode中的GTF文件注释基因ID
小张小张
2023/05/25
1.9K0
2023.4生信马拉松day7-R语言综合应用
-(3)注意:之前提到过,矩阵的某一列不能单独转换数据类型,需要把矩阵转换成数据框再转换某列的数据类型;或者把这列单独提取出来再转换其数据类型;
清南
2023/04/20
3.7K0
Day07 生信马拉松-数据整理中的R
step1 对matrix进行转置:使gene名变为列名,将样本名转化为data.frame中的第一列
大冬仔
2023/08/16
2590
温故而知新,ggplot2 饼图的几点笔记
其实 ggplot2 并没有类似于 geom_pie() 这样的函数实现饼图的绘制,它是由 geom_bar() 柱状图经过 coord_polar() 极坐标弯曲从而得到的。 对于为什么 ggplot2 中没有专门用于饼图绘制的函,有人说:“柱状图的高度,对应于饼图的弧度,饼图并不推荐,因为人类的眼睛比较弧度的能力比不上比较高度(柱状图)。” 关于饼状图被批评为可视化效果差,不推荐在 R 社区中使用的文章在网络也有不少,感兴趣的可以去搜一下。
章鱼猫先生
2021/10/15
1.4K0
温故而知新,ggplot2 饼图的几点笔记
40. R 数据整理(十一: 用purrr包实现更花样的匿名函数使用)
其实map 除了对向量有用,也可以作用于数据框或矩阵类型,相当于把其中的每一列作为一个单独的元素来看,有点像按列的apply:
北野茶缸子
2021/12/17
2.6K0
R语言︱数据分组统计函数族——apply族用法与心得
笔者寄语:apply族功能强大,实用,可以代替很多循环语句,R语言中不要轻易使用循环语句。
悟乙己
2019/05/28
3.5K0
推荐阅读
相关推荐
R语言的常用函数速查
更多 >
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文