首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

【R语言经典实例3】计算基本统计量

实际上没有那么复杂。 R软件,用简单的函数便能完成标准差和其他基本统计量的计算。...某个变量的一个缺失值就有可能导致函数返回NA结果,甚至可能造成计算计算过程中报错: > x <- c(0,1,1,2,3,NA) > mean(x) [1] NA > sd(x) [1] NA 虽然...对于R软件返回的结果你应该慎重地考虑:数据的缺失值是否会严重影响统计结果?...如果是,那么R软件返回错误结果是正确的;如果不是,则可以通过设置参数na.rm=TRUE, 告知R软件忽略缺失值: > x <- c(0,1,1,2,3,NA) > mean(x, na.rm=TRUE...) [1] 1.4 > sd(x, na.rm=TRUE) [1] 1.140175 mean函数和sd函数能巧妙地处理数据框数据,自动将数据框的每一列认为是不同的变量,并对每列数据分别进行计算

2K20

R语言入门之基本统计量

基本统计量计算 mean(a) #由于有NA值,直接计算平均值返回的是NA # [1] NA mean(a,na.rm = T) #去除NA值后再计算平均值 #[1] 2.75 sum(a,na.rm...= T) #去除NA值后再求和 #[1] 11 sd(a,na.rm = T) #去除NA值后再计算标准差 #[1] 1.707825 var(a,na.rm = T) #去除NA值后再计算方差 #[1...] 2.916667 sqrt(var(a,na.rm = T)) #方差取平方根后就是标准差,计算结果和sd()一致 #[1] 1.707825 min(a,na.rm = T) #去除NA值后再计算最小值...#[1] 1 max(a,na.rm = T) #去除NA值后再计算最大值 #[1] 5 median(a,na.rm = T) #去除NA值后再计算中位数 # [1] 2.5 quantile(a,...psych包我们可以使用describe.by()函数直接获得数据的基本统计量,这里面有四个统计量trimmed(trimmed mean,切尾均值)、mad(median absolute deviation

93650

因子列表缺失数据

R名义型变量和有序性变量称为因子,factor。这些分类变量的可能值称为一个水平level,由这些水平值构成的向量就称为因子。因子主要用于计算频数,可以用来分组。...可以通过factor()函数的labels选项对因子的值进行批量修改。... R NA 代表缺失值,NA 是不可用,not available 的简称,用来存储缺失信息。...x <- 1:5 x x[7] <- 7 x sum(x) sum(x,na.rm = T) is.na(x) mean(x,na.rm = T) x[6] <- mean(x,na.rm = T) x...类是现实世界或思维世界的实体计算的反映,它将数据以及这些数据上的操作封装在一起。对象(object)是具有类类型的变量。R 类是将各种数据整合在一起,本质上是一种列表。

41910

R语言之缺失值处理

缺失值处理 实际的数据分析,缺失数据是常常遇到的。缺失值(missing values)通常是由于没有收集到数据或者没有录入数据。 例如,年龄的缺失可能是由于某人没有提供他(她)的年龄。...识别缺失值 R ,缺失值用 NA 表示,是“Not Available”的缩写。函数 is.na( ) 可以用于识别缺失值,其返回结果是逻辑值 TRUE 或 FALSE。...例如: mean(height) # 想要得到所有可参与计算的元素的平均值,应该先将 NA 从向量移除。...mean(na.omit(height)) 注意,这里 na.omit( ) 是一个独立的函数,它能忽略输入对象的缺失值,而 na.rm 只是计算描述性统计量的函数里的一个内部参数。...函数 summary( ) 计算向量的统计量时会自动忽略缺失值,它会给出向量缺失值的个数。例如: summary(height) # Min. 1st Qu.

47720

35. R 数据整理(七:使用tidyr和dplyr处理数据框 2.0)

这些变量应该是真正的属性,而不是同一属性不同年、月等时间的值分别放到单独的列。...指定变量名时不是写成字符串形式而是直接写变量名: d.class %>% distinct(sex, age) %>% knitr::kable() 如果希望保留数据框其它列,可以加选项 keep_all...offset 表示忽略n个。忽略最后一个即表示选择倒数第二个。 2.6 arrange 按照数据框里的某列或某几列,对所有行进行排序。....)), na.rm=TRUE) %>% knitr::kable() 其中的变量子集也可以用序号范围表示,或者用 vars() 函数写成不加撇号的格式,比如vars(v0, v1)。....)), na.rm=TRUE) %>% knitr::kable() summarise_all 直接对所有变量进行计算: d.cancer %>% select(v0, v1) %>% summarise_all

10.7K30

106-R可视化30-底层绘图系统grid学习之重头创建ggplot对象之一

[[91-R可视化23-底层绘图系统grid学习之grob对象]] 与[[96-R可视化25-底层绘图系统grid学习之viewports]] ,我们分别学习了操作viewport与创建底层grob...= FALSE stat_identity: na.rm = FALSE position_identity > tmp2 <- ggplot2::layer() 错误: Attempted to...,这样的方法虽然透明度上没有什么问题,不过如果是在其他分类时,比如说按照列对shape 进行区分,则在分面是可能会有一些问题。...这个主要是每次计算,geom 都会根据分类获得的subgroup data 进行计算,虽然这样帮我们抽象了分组的方法,但是却可能造成分面与原先数据的差异,如果有这点的考虑的话,建议设计data 时,就新增用于图形属性绘制的一列...可问题是,我前面也提到了,我们自己创建的这个geom_** 对象,根本没有办法接收诸如color, fill, alpha 在内的属性。这又改如何把data 的对应列给到图像呢?

78130

R语言系列第三期:②R语言多组汇总及图形展示

事实上,我们实验或者调查之后的分析往往希望通过分组比较来获得有统计学意义的结果,因此分组数据我们平常的工作更加常见,也更加科学严谨,那么我们就来了解下分组数据的描述。...因此,计算数值向量组成的数据框每个变量的均值可以如下操作: > lapply(thuesen,mean,na.rm=T) $blood.glucose [1] 10.3 $short.velocity...语言系列1里我们提到的,唯一没有提的是里面的参数命名,等号前是名称,等号后接的是变量。...,同样的,这个方式是不能忽略缺失值的。...那么需要添加参数na.rm=T: > tapply(igf1,tanner,mean,na.rm=T) I       II      III       IV        V 207.4727  352.6714

1.7K00

R语言raster包读取栅格遥感影像

可以看到,我们安装raster包时,会自动将其所需依赖的其他包(如果在此之前没有配置过)都一并配置好,非常方便。   接下来,输入如下的代码,从而将刚刚配置好的raster包导入。...例如,我们可以通过mean()函数与sd()函数,计算栅格图像全部像元数值的平均值和标准差;这里我们用到了na.rm = TRUE参数,具体含义稍后会提到。...此外,我们还可以基于mean()等函数,对栅格图像的基本数学统计信息加以计算。...不过在对多个栅格图像数据加以计算时需要注意,tif_file_all后是否添加[]符号,得到的结果是不一样的——如果不添加[]符号,我们相当于是加以逐像元分析,对每一个位置的像元12个图层的数值加以统计...,并计算该像元12个图层的平均值;因此最终所得结果是一景新的栅格图像,图像的每一个像元数值都表示该像元12个图层的平均值。

37420

r语言求平均值_r语言计算中位数

平均值是通过取数值的总和并除以数据序列的值的数量来计算,函数mean()用于R中计算平均值,语法如下: mean(x, trim = 0, na.rm = FALSE, ...)...na.rm – 用于从输入向量删除缺少的值。...如果缺少值,则平均函数返回NA,我们如果要从计算删除缺少的值,可以使用na.rm = TRUE, 这意味着删除NA值。...好啦,来综合看下实例: 输出结果为: 数据系列的中间值被称为中位数,R中使用median()函数来计算中位数,语法如下: median(x, na.rm = FALSE) 参数描述如下: x...R没有标准的内置函数来计算众数,因此,我们将创建一个用户自定义函数来计算R的数据集的众数。该函数将向量作为输入,并将众数值作为输出,来分别看下实例: 输出结果为: 好啦,本次记录就到这里了。

2.1K10
领券