首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

R语言中的批处理函数

在R语言中,apply系列函数作为批量处理函数,可以循环遍历某个集合内的所有或部分元素,以简化操作。这些函数底层是通过C来实现的,所以效率也比手工遍历来的高效。...apply族函数分别有apply函数,tapply函数,lapply函数,mapply函数。每一个函数都有自己的特点,在处理不同类型的数据可以选用相对应的函数。...apply函数一般有三个参数,第一个参数代表矩阵对象,第二个参数代表要操作矩阵的维度,1表示对行进行处理,2表示对列进行处理。第三个参数就是处理数据的函数。apply会分别一行或一列处理该矩阵的数据。...其中参数na.rm=TRUE,可以忽略所用的NA值 ? 2.lapply和sapply函数 lapply和sapply函数可以用于处理列表数据和向量数据(vector/list)。...3.tapply函数 它通常会有三个参数,第一个参数代表数据,第二个参数表示如何对数据进行分组操作,第三个参数指定每一个分组内应用什么函数。

2.7K20

R语言系列第三期:②R语言多组汇总及图形展示

在这里我们就得介绍一下R的隐式循环了,之前我们学习过while循环,repeat,break循环,for循环;循环的一个常用功能是把一个函数应用到一组值或者向量中的每一个元素,并将结果返回。...在R中,就可以使用lapply()和sapply()两个函数实现。前一个总是返回列表(用“l”标识),而后者则尽可能将结果简化(用“s”标识)成向量或矩阵。...tapply()函数用来创建表格(用“t”标识),该表由函数关于第二个参数定义的子组上的返回值构成,其中子组参数可以是一个因子或者一列因子。后一种情形生成一个交叉分类表。...列表元素的名称通常作为输出结果列的名称。由于函数应用于整个数据框,所以可以选择数据框的子集进行运算,这里是选择了数值变量。...前一个里有一个“~”y~x前后的两个元素关系是用x表达y。这是我们在模型公式里经常看到的符号。之后在回归方程的建立过程中经常使用。

1.7K00
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    R|apply,tapply

    apply族功能强大,实用,可以代替很多循环语句,先简单介绍apply和tapply函数。 一、apply()函数 apply函数可将一个任意函数“应用”到矩阵、数组、数据框的任何维度上。...其中x为数据对象,MARGIN是维度的下标,FUN是由你指定的函数,而...则包括了任何想传递给FUN的参数。在矩阵或数据框中, MARGIN=1表示行, MARGIN=2表示列。...二、tapply()函数 tapply()函数可根据因子、向量和要计算的函数计算,使用格式如下: tapply(X, INDEX, FUN = NULL, ..., simplify = TRUE)...其中X通常是一向量;INDEX是一个list对象,且该list中的每一个元素都是与X有同样长度的因子;FUN是需要计算的函数;simplify是逻辑变量,若取值为TRUE(默认值),且函数FUN的计算结果总是为一个标量值...,那么函数tapply返回一个数组;若取值为FALSE,则函数tapply的返回值为一个list对象。

    70780

    R语言中的循环函数(Grouping Function)

    R语言中有几个常用的函数,可以按组对数据进行处理,apply, lapply, sapply, tapply, mapply,等。这几个函数功能有些类似,下面介绍下这几个函数的用法。...其格式是: Apply(数据,维度Index,运算函数,函数的参数) 对于Matrix来说,其维度值为2,第二个参数维度Index中,1表示按行运算,2表示按列运算。...函数有一个参数na.rm,我们可以将这个参数带人到apply函数中,作为第4个参数: apply(m,1,sum,na.rm=TRUE) [1] 9 8 需要注意的是如果是Data Frame,那么系统会将其转为...我们建立一个学生名字,年龄和成绩的Data Frame,然后统计平均年龄和平均成绩,由于name列不是数值类型,所以无法算平均值,所以我们可以对非数值的数据只取count数量。...Tapply 前面介绍的几个apply函数都是对整体数据进行处理,而tapply是对向量中的数据进行分组处理。

    1.5K20

    【基础】R语言2:数据结构

    数据类型数值型:用于直接计算加减乘除字符串型:可以进行连接,转换,提取等逻辑型:真或假日期型等R对象R语言中的变量可以赋值给变量的任何事物,包括常量、数据结构、函数甚至图形对象都拥有某种模式,描述此对象是如何储存的...a=2向量索引正负整数索引length(x) #向量中有多少个元素x[1] #访问向量第一个值 x[-19] #不输出第19个元素x[c(4:18)] #输出x中第4-18个元素x...#整除运算#元素个数不相等,短的向量会被重复使用#判断相等:== 一个=是赋值3.逻辑计算%in% #包含运算符> #大于列分布2.dim函数dim(x)=c(4,5)# 绘图heatmap.()# 定义矩阵行、列的名字rownames=c("R1","R2","R3")cnamesdimnames...164.5000第一自变量h与与第二自变量sex是等长的, 对应元素分别为同一人的身高和性别, tapply()函数分男女两组计算了身高平均值

    10710

    R语言︱数据分组统计函数族——apply族用法与心得

    (1:4, fac, sum) 1 2 3 4 5 5 2 3 NA NA #当index不是因子时,可以用as.factor()把参数强制转换成因子 额外案例,实现excel中数据透视表的功能...lapply的使用格式为: lapply(X, FUN, ...) lapply的返回值是和一个和X有相同的长度的list对象, 这个list对象中的每个元素是将函数FUN应用到X的每一个元素。...其中X为List对象(该list的每个元素都是一个向量), 其他类型的对象会被R通过函数as.list()自动转换为list类型。...sapply的变形版,mapply 将函数 FUN 依次应用每一个参数的第一个元素、第二个元素、第三个元素上。...在vapply函数中总是会进行简化,vapply会检测FUN的所有值是否与FUN.VALUE兼容, 以使他们具有相同的长度和类型。

    3.5K30

    R语言的数据结构(包含向量和向量化详细解释)

    更多内容请参考《R语言编程艺术》 ——————————————— 向量类型是R语言的核心。深入理解向量对R中数据结构及其操作,函数的开发和应用有着重要意义。...也就是说,向量的所有元素必须属于同种模式(mode),或数据类型(见1.2),比如数值型,字符型等。其类型可以用typeof()查看。 标量只含有一个元素,在R中没有0维度或标量类型。...其中进行的是x中的每一个元素一次进行ifelse中的逻辑判断,返回相应的值,自动进行了循环补齐。所以ifelse是向量化的。...over under F 12300.00 39050 M 73166.67 NA split 只是形成分组 注意,这点和tapply不同,tapply是将向量分割为组,然后针对每个组应用制定函数...tapply好像很适合,因为分组,应用函数。但是,tapply的第一个参数必须是向量,不能是矩阵或数据框,而回归分析必须至少两列的数据或数据框,其中第一列是被预测的变量,第二列或多列是预测变量。

    7.1K20

    R海拾遗-apply家族学习

    概述 在实际的工作中,我们总要面对各种各样的数据结构处理,这些操作可以使用循环来完成,但是容易造成内存的占用,以前其实了解过这方面的函数,但是记不清,因此整理下 主要函数如下 apply lapply...3.057333 3.758000 1.199333 lapply函数 lapply函数和apply函数的差别在于,lapply输出的为一个列表 参数方面少了margin 示例...xna.rm=T) # 因为输出的为list格式,因此一般情况下需要使用unlist函数进行分解 unlist(x) sapply函数 Sapply函数返回的是一个向量...函数 tapply函数一般对数据进行分组描述时使用 tapply(X, INDEX, FUN = NULL) 参数 -X: 一个对象,一般都是向量 -INDEX: 一个包含分类因子的列表 -FUN: 对...X里面每个元素进行操作的函数 示例 data(iris) # 对第一列进行分组求均值 tapply(iris[,1],iris$Species,mean) # 结果 setosa versicolor

    80630

    R语言-因子和表

    因子和表因子(factor)是R语言中许多强大运算的基础,因子的设计思想来着统计学中的名义变量(分类变量),因子可以简单的看做一个附加了更多信息的向量。...tapply执行操作,将x分组,每组对应一个因子水平(多音字情况下,对应一组水平的组合,然后向量应用于函数g),注意:f中每个因子需要与x具有相同的长度,返回值是向量或者矩阵,x必须是向量> data1...175 NA 1732.split()函数和tapply()函数不同,split()只分组,x可为数据框或向量,返回值是列表> split(data1$name,data1$性别)#对name...cumsum()函数,累计和,第n个元素是1加到n的和pmax(a,b)函数返回一个向量,第i个元素是ai与bi中的最大值、pmin(a,b)函数返回一个向量,第i个元素是ai与bi中的最小值match...(x,y)函数,返回一个和x的长度相同的向量,表示x中与y中元素相同的元素在y中的位置(没有则返回NA)choose(n,k),求组合数,从n个中选出Kunique(x),如果x是一个向量或数据框,则返回一个类似的对象但是去掉所有重复的元素

    9310

    温故知新--R基础知识(上)

    · 数据框(data frame)是和矩阵类似的一种结构。在数据框中,列可以是不同的对象。可以把数据框看作是一个行表示观测个体并且(可能)同时拥有数值变量和分类变量的‘数据矩阵’。...对象持久化 R会话中创建的所有对象可以永久地保存在一个文件中以便于以后的R会话调用。在每一次R会话结束的时候,你可以保存当前所有可用的对象。...任何含有NA 数据的运算结果都将是NA。 函数is.na(x)返回一个和x同等长度的向量。它的某个元素值为TRUE 当且仅当x中对应元素是NA。...实数或复数向量,逻辑向量和字符串向量之类的对象属于"原子"型的对象,因为它们的元素都是一样的类型或模式。R的对象类型包括数值型,复数型,逻辑型,字符型和原生型。向量必须保证它的所有元素是一样的模式。...当一个元素或者值在统计的时候"不可得到"(notavailable)或者"值丢失"(missing value),相关位置可能会被保留并且赋予一个特定的值NA,对象有内在属性和外在属性,因子中常用levels

    1.2K30

    用R语言做数据清理(详细教程)

    -50k","f50k-100k",其中m代表男性,f代表女性),还有更过分的将列表的变量不仅储存在列中,行中也有统计变量。...我们以UCI的Human Activity Recognition Using Smartphones Data Set 为例来看看数据是如何变成一个基本符合要求的数据。...all,all.x,all.y:默认的all = FALSE相当于自然连接, 或者说是内部链接. all.x = TRUE是一个左连接, all.y = TRUE是一个又连接, all = TRUE 相当于一个外部链接...另外值得一提的是,对于某些特定的数据,也许xtabs,ftable是有用的。 数据的筛选 要提取相应内容的数据,最为常用的就是提取相应元素,比如提取某个元素,提取某一行,某一列。...8 15 ## 4 4 9 11 ## 1 2 9 14 ## 3 3 NA 12 有些时候,更为强大的aggregate函数是我们需要的,我们以R的内置数据集

    5.5K60

    R语言 常见函数知识点梳理与解析 | 精选分析

    ) 5、complete.cases( ) 判断对象中是否数据完全 6、grep()找出所数据框中元素所在的列值(仅数据框中) 7、assign()通过变量名的字符串来赋值 8、 split()根据因子变量拆分数据框.../向量 9、unique()返回 x 但是省去重复的数值 10、round(),floor()和ceiling() 11、sign() 符号函数 12、%in% 检验x是否为集合y中的元素(x%in%y...(x) [1] TRUE TRUE FALSE TRUE > x[complete.cases(x),] [1] 1 2 4 6、grep()找出所数据框中元素所在的列值(仅数据框中) > x 是一个具名参数,可以列出所有名称中含有字符串“s”的对象。...rbind:把行合并为矩阵 diag:矩阵对角元素向量或生成对角矩阵 aperm:数组转置 nrow, ncol:计算数组的行数和列数 dim:对象的维向量 dimnames:对象的维名 row/colnames

    2.3K21

    R语言中 apply 函数详解

    apply函数集来转换R中的数据 介绍 数据操作是机器学习生命周期中最关键的步骤之一。...今天,我们将使用R并学习在R中转换数据时使用最广泛的一组“apply”函数。这组函数提供了对数据的高效和快速操作。当我们只想处理某些列时,这特别有用。这组函数称为apply()函数。...tapply mapply 设置上下文 我将首先通过使用简单的数据集介绍上面的每个函数是如何工作的,然后我们将使用一个真实的数据集来使用这些函数。...使用tapply()非常容易,因为它会自动从item_cat 向量 中获取唯一的值,并几乎立即对数据应用所需的函数。...尾注 到目前为止,我们学习了R中apply()函数族中的各种函数。这些函数集提供了在一瞬间对数据应用各种操作的极其有效的方法。本文介绍了这些函数的基础知识,目的是让你了解这些函数是如何工作的。

    20.5K40

    【R的极客理想系列文章】RHadoop培训 之 R基础课

    数据框(data frame)是和矩阵类似的一种结构。在数据框中,列可以是不同的对象。可以把数据框看作是一个行表示观测个体并且(可能)同时拥有数值变量和分类变量的`数据矩阵’ 。...is.na(x)] 正整数向量:索引向量必须是1, 2, … , length(x)的子向量。索引向量中索引对应的元素将会被选中,并且在结果向量中的次序和索引向量中的次序一致。...任何含有NA 数据的运算结果都将是NA。 函数is.na(x)返回一个和x同等长度的向量。它的某个元素值为TRUE 当且仅当x中对应元素是NA。...这包括一个和M 列空间一致的正交列U 的矩阵,一个和M 行空间一致的正交列V 的矩阵,以及一个正元素D 的对角矩阵,如M = U %*% D %*% t(V)。D 实际上以对角元素向量的形式返回。...数据框常常会被看作是一个由不同模式和属性的列构成的矩阵。

    2.9K20

    R常用基本 函数汇总整理

    + command 这是学习和使用R最常用到的命令。 help.search() 或者??...file.show() 显示文件内容,是R help system的核心函数 tempfile() 返回一个"临时文件"名 tempdir() 返回一个可写入的临时目录名,通常是用户家目录下的临时目录...(列)和或行(列)均值 rowsum() 对矩阵的每一列,分组计算数值之和 cov,var,cor 相关系数或相关系数阵 fivenum() 产生Tukey's five number...中的变量执行某函数 unique() 去掉重复的元素 rep() 按照指定方式重复向量中的元素 cut() 将一个数值向量中的元素按指定的方式划分区间,返回一个factor变量..., 但是返回一个向量,如果每次函数操作只产生一个元素 tapply () 对所给变量按照指定的分组方式分别运行一个函数 mapply rapply eapply range() 返回所有指定对象的最大和最小值

    1.9K30
    领券