R-如何获取不同列的非NA间隔的平均值/中位数/sd？

R语言中可以使用函数na.aggregate()来获取不同列的非NA间隔的平均值、中位数和标准差（sd）。

na.aggregate()函数属于zoo包，需要先安装并加载该包。可以使用以下代码安装和加载zoo包：

install.packages("zoo")
library(zoo)

假设有一个数据框df，其中包含多个列，每列可能包含NA值。要获取不同列的非NA间隔的平均值、中位数和标准差，可以使用以下代码：

# 获取非NA间隔的平均值
mean_values <- na.aggregate(df, FUN = mean)

# 获取非NA间隔的中位数
median_values <- na.aggregate(df, FUN = median)

# 获取非NA间隔的标准差
sd_values <- na.aggregate(df, FUN = sd)

在上述代码中，df是要处理的数据框，FUN参数指定了要应用的函数（平均值、中位数或标准差）。na.aggregate()函数会对每列进行处理，并返回一个新的数据框，其中包含了非NA间隔的平均值、中位数和标准差。

需要注意的是，na.aggregate()函数会将每列的NA值替换为相应的统计量，因此返回的结果可能会有一些列仍然包含NA值。如果需要移除包含NA值的列，可以使用na.omit()函数。

这是一个使用R语言进行非NA间隔的平均值、中位数和标准差计算的示例。希望对你有帮助！

相关·内容

数据分析|R-描述性统计

前文介绍了脏数据中缺失值数据分析|R-缺失值处理和异常值数据分析|R-异常值处理的常规处理方法，之后就可以对数据进行简单的描述性统计，方便我们对数据有一个整体的认识。...常见描述性统计可以通过最小值、下四分位数、中位数、上四分位数和最大值，均值、众数、标准差、极差等查看数据的分布和离散程度；通过偏度（数据分布形态呈现左偏或右偏）和峰度（分布形态呈现尖瘦或矮胖）等查看数据的正态与否...下面简单的介绍如何使用R实现数值型变量的上述统计量。 1 基础包中summary()函数可得到数值型变量的最小值、下四分位数、中位数、上四分位数和最大值。...:335.0 2 psych包中describe()函数可得到非缺失值的个数、均值、标准差、中位数、截尾平均数、绝对中位差、最小值、最大值、极差、偏度、丰度和平均值的标准误 #install.packages...= TRUE); Sd = sd(x, na.rm = TRUE); Range = abs(diff(range(x))); skew <- sum((x-Mean)^3/Sd^3)/N

1.5K3 0

小数据| 描述性统计（PythonR 实现）

1.3 中位数 对于数据集合（x1， x2， …， xn），将所有的数值按照它们的大小，从高到低或从低到高进行排序，如果数据集合包含的数值个数是基数，那么排在最中间的数值就是该数据集合的中位数...；如果数据集合的数值个数是偶数，那么取最中间两个数值的算术平均值作为中位数。...二数据的离散程度集中趋势指标在表示数据集合的特征时会有不同的缺陷，例如算术平均数会受到极端值的影响，不能完全展现数据集合的特征，离散程度指标可以在一定程度上弥补集中趋势指标的这个缺陷，...因此，如果比较算术平均值不同的两个数据集合的相对离散程度时，使用变异系数要比使用标准差更具有说服力。此外，变异系数是无单位指标，这是它与其他离散程度指标最大的区别。...na.rm = TRUE); Sd = sd(x, na.rm = TRUE); Range = abs(diff(range(x))); #返回结果 return(data.frame

9922 0

（数据科学学习手札19）R中基本统计分析技巧总结

在获取数据，并且完成数据的清洗之后，首要的事就是对整个数据集进行探索性的研究，这个过程中会利用到各种描述性统计量和推断性统计量来初探变量间和变量内部的基本关系，本篇笔者便基于R，对一些常用的数据探索方法进行总结...()函数： Hmisc包中的describe()函数可返回变量和观测的数量、缺失值和唯一值的数目、平均值、分位数，以及五个最大的值和五个最小的值： > library(Hmisc) > Hmisc::describe...若desc=TRUE（默认值），则计算中位数、平均数、平均数的标准误差、平均数置信度为95%的置信区间、方差、标准差以及变异系数。...describe()计算描述性统计量：在psych包中，可以通过describe()来计算非缺失值的数量、平均数、标准差、中位数、截尾均值、绝对中位数、最小值、最大值、值域、偏度、峰度和平均值的标准误差...；Spearman等级相关系数则衡量分级定序变量之间的相关程度；Kendall’s Tau相关系数也是一种非参数的等级相关度量。

2.5K10 0

R in action读书笔记（5）-第七章：基本统计分析

is.na(x)] +m<-mean(x) +n=length(x) +s<-sd(x) +skew<-sum((x-m)^3/s^3)/n +kurt<-sum((x-m)^4/s^4)/n-3 +return...()函数可返回变量和观测的数量、缺失值和唯一值的数目、平均值、分位数，以及五个最大的值和五个最小的值通过Hmisc包中的describe()函数计算描述性统计量: >describe(mtcars[...若desc=TRUE（同样也是默认值），则计算 中位数、平均数、平均数的标准误、平均数置信度为95%的置信区间、方差、标准差以及变异系数。...，它可以计算非缺失值的数量、平均数、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、值域、偏度、峰度和平均值的标准误。...如果使用的是list(mtcars$am)，则am列将被标注为Group.1而不是am。你使用这个赋值指定了一个更有帮助的列标签。

5283 0

dpois函数_frequency函数

此图的形状非常有特色：无论何时绘制平均值（或其他摘要）与组大小，都会看到随着样本量的增加，变化会减小。...这种模式还有另一种常见的变化。让我们来看看棒球击球手的平均表现如何与他们击球的次数有关。在这里，使用来自拉赫曼包的数据来计算每个大联盟棒球运动员的击球率（击球次数/尝试次数）。...5.6.4 实用的汇总功能只使用平均值，计数和求和就可以获得很长的路要走，但R提供了许多其他有用的汇总函数：衡量定位：我们使用均值mean(x)，但中位数median(x)也很有用。...均方根偏差或标准差sd(x)是离散的标准度量。四分位数范围IQR(x)和中位数绝对偏差mad(x)是稳健的等价物，如果有异常值可能会更有用。...换句话说，分组总和的总和是总和，但分组中位数的中位数不是总体中位数。 5.6.6 取消组合如果需要删除分组，并返回对未分组数据的操作，使用ungroup()。

1.8K1 0

【R语言经典实例3】计算基本统计量

问题如何使用R软件计算下列统计量：均值、中位数、标准差、方差、协方差和相关系数。...某个变量中的一个缺失值就有可能导致函数返回NA结果，甚至可能造成计算机在计算过程中报错： > x <- c(0,1,1,2,3,NA) > mean(x) [1] NA > sd(x) [1] NA 虽然...) [1] 1.4 > sd(x, na.rm=TRUE) [1] 1.140175 mean函数和sd函数能巧妙地处理数据框数据，自动将数据框中的每一列认为是不同的变量，并对每列数据分别进行计算。...下面的例子展示了mean和sd函数对有三列的数据框的计算结果： > print(dframe) small mediumbig 1 0.6739635 10.526448...var函数也能处理数据框数据，但处理方式与mean函数和sd函数有些许不同。

2K2 0

R 与 Python 双语解读统计分析基础

，平均值、标准差、方差以及中位数。...具有未知值的向量的平均值也是未知的。但是，你可以使用 na.rm 参数（设为不可用，相当于删除）将缺失值删除。...:30.000 NA's :859 注意因子变量的显示如何变化。...通过将 breaks 指定为向量而不是数字，则可以非均匀地控制间隔的划分。下面数据包含了一个按年龄组划分的事故率示例。...如果由于某种原因，你想要其中列高为每个间隔中的原始数字的那种直方图，则可以使用 freq = T 进行指定。

2K1 0

R语言入门之基本统计量

基本统计量计算 mean(a) #由于有NA值，直接计算平均值返回的是NA # [1] NA mean(a,na.rm = T) #去除NA值后再计算平均值 #[1] 2.75 sum(a,na.rm...= T) #去除NA值后再求和 #[1] 11 sd(a,na.rm = T) #去除NA值后再计算标准差 #[1] 1.707825 var(a,na.rm = T) #去除NA值后再计算方差 #[1...] 2.916667 sqrt(var(a,na.rm = T)) #方差取平方根后就是标准差，计算结果和sd()一致 #[1] 1.707825 min(a,na.rm = T) #去除NA值后再计算最小值...#[1] 1 max(a,na.rm = T) #去除NA值后再计算最大值 #[1] 5 median(a,na.rm = T) #去除NA值后再计算中位数 # [1] 2.5 quantile(a,...，最大值，25%分位数，中位数，75%分位数以及NA值的个数（它的计算是自动去除缺失值的） b <- c("red", "white", "red", "blue", NA) # 创建变量b c <-

9325 0

左手用R右手Python系列10——统计描述与列联分析

数据统计描述与列联表分析是数据分析人员需要掌握的基础核心技能，R语言与Python作为优秀的数据分析工具，在数值型数据的描述，类别型变量的交叉分析方面，提供了诸多备选方法。...sapply() #可自由定义输出统计量 mystats <- function(x, na.omit=FALSE){ if (na.omit) x <- x[!...is.na(x)] m <- mean(x) n <- length(x) s <- sd(x) skew <- sum((x-m)^3/s^3)/n kurt <- sum((x-m...psych::describe(diamonds[myvars]) #可以计算非缺失值的数量、平均值、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、值域、偏度、峰度和平均值的标准误。 ?...pandas的交叉表函数pd.crosstab参数设定规则与透视表保持了很高的相似度，确实从呈现形式上来讲，数值型变量的尽管聚合方式有很多【均值、求和、最大值、最小值、众数、中位数、方差、标准差、求和等

3.4K12 0

计算与推断思维十二、为什么均值重要

，最大值，中位数和平均值。...平均值拉向了尾巴的方向。所以我们预计平均薪酬会比中位数大，事实确实如此。...这是例子，说明了为什么 SD 是延展度的有效度量。无论直方图的形状如何，平均值和 SD 一起告诉你很多东西，关于直方图在数轴上的位置。...母亲的平均身高为 64 英寸，SD 为 2.5 英寸。与篮球运动员的身高不同，母亲身高关于钟形曲线中的平均值对称分布。...由于分布的形状，“中心”具有明确的含义，在 64 处清晰可见。如何定位钟形曲线上的 SD 要看 SD 如何与曲线相关，请从曲线顶部开始，向右看。

1K2 0

小蛇学python（18）pandas的数据聚合与分组计算

image.png 你一定注意到，在执行上面一行代码时，结果中没有key2列，这是因为该列的内容不是数值，俗称麻烦列，所以被从结果中排除了。...函数名说明 count 分组中的非NA的值的数量 sum 非NA值的和 mean 非NA值得平均值 median 非NA值的算术中位数 std var 标准差，方差 max min 最大值，最小值 prod...非NA值的积 first last 第一个和最后一个非NA值更加高阶的运用我们拿到一个表格，想添加一个用于存放各索引分组平均值的列。...image.png 这样就实现了，people表格里的数据减去同类型数据平均值的功能。这个功能叫做距平化，是一个经常使用的操作。...是不是很神奇，如果不相信，我们可以来验证一下，按理说减去平均值后，数据的平均值会变成零。 ? image.png 可以看出来，就算不为零，也是很小的数。

2.4K2 0

python数据处理 tips

磐创AI分享作者 | June Tao Ching 编译 | VK 来源 | Towards Data Science 数据清理是任何项目中最关键的一步，如果处理不当，可能会得出完全不同的结论...如果我们在读取数据时发现了这个问题，我们实际上可以通过将缺失值传递给na_values参数来处理这个缺失值。结果是一样的。现在我们已经用空值替换了它们，我们将如何处理那些缺失值呢?...例如，我们可以计算年龄和出生日期的缺失值。在这种情况下，我们没有出生日期，我们可以用数据的平均值或中位数替换缺失值。...注：平均值在数据不倾斜时最有用，而中位数更稳健，对异常值不敏感，因此在数据倾斜时使用。在这种情况下，让我们使用中位数来替换缺少的值。 ?...df["Age"].median用于计算数据的中位数，而fillna用于中位数替换缺失值。现在你已经学会了如何用pandas清理Python中的数据。我希望这篇文章对你有用。

4.3K3 0

R数据科学|3.6内容介绍

上节我们对选择现有的列和使用mutate添加新列做了介绍。现在对数据框使用summarize()进行分组摘要进行介绍。...为了说明管道如此有用的原因，我们将探究同一段代码的不同编写方式。...is_na())：对非缺失值的计数 n_distinct()：计算出唯一值的数量 count()：一个简单的辅助函数，用于只需要计数的情况 3.6.4 常用的摘要函数位置度量：median(x),mean...分散程度度量：sd(x)、IQR(x)和 mad(x) 均方误差（又称标准误差，standard deviation，sd）是分散程度的标准度量方式。...换句话说，对分组求和的结果再求和就是对整体求和，但分组中位数的中位数可不是整体的中位数。

9742 0

R语言笔记完整版

上体顶部和底部为上下四分位数，中间粗线为中位数，上下伸出的垂直部分为数据的散步范围，最远点为1.5倍四分为点，超出后为异常点，用圆圈表示。...不同的数据，x和y是没有重复的同一类数据，比如向量集，重复不同不记 setequal(x, y)——判断x与y相同，返回逻辑变量，True为相同，False不同。...as.matrix()[，1]——把数据框转化为矩阵后，再去提取列向量 na和NULL的区别 is.na()——判断na值存在，na是指该数值缺失但是存在。...：中位数，下上四分位数，最小值，最大值数学函数 sum（x,y,z，na.rm=FALSE）——x+y+z，na.rm为TURE可以忽略掉na值数据 sum...breaks设置直方图横轴取点间隔，如seq(0,550,2)表示间隔为2，从0到550之间的数值。

4.1K4 1

数据分析|R-异常值处理

前面介绍了拿到脏数据后，对缺失值的处理数据分析|R-缺失值处理，今天分享一下另一种脏数据-异常值的处理。异常值一般会拉高或拉低数据的整体情况，因此需要对异常值进行处理。...1.2 平均值±3个标准差方法 set.seed(1) test <- c(rnorm(100, mean = 5, sd = 1), runif(100, min = 0.1, max = 50))...min<-mean(test)-3*sd(test) max<-mean(test)+3*sd(test) #返回异常值的下标 which(test > max) #返回异常值的数值 test[which...(test > max)] 1.3 四分位数和四分位距方法 #获取上下四分位数和四分位距 set.seed(1) test Q_shang + 1.5*Q_range )] <- imp1 test1[c(111,114,115)] 39.7537 39.7537 39.7537 当然也可以根据实际情况用中位数或者均值替代

1.2K1 0

pandas读取表格后的常用数据处理操作

2.4K0 0

学徒讨论-在数据框里面使用每列的平均值替换NA

最近学徒群在讨论一个需求，就是用数据框的每一列的平均数替换每一列的NA值。但是问题的提出者自己的代码是错的，如下： ? 他认为替换不干净，应该是循环有问题。...#我好像试着写出来了，上面的这个将每一列的NA替换成每一列的平均值。 #代码如下，请各位老师瞅瞅有没有毛病。...：我是这么想的，也不知道对不对，希望各位老师能指正一下：因为tmp数据框中，NA个数不唯一，我还想获取他们的横坐标的话，输出的结果就为一个list而不是一个数据框了。...答案二：使用Hmisc的impute函数我给出的点评是：这样的偷懒大法好！使用Hmisc的impute函数可以输入指定值来替代NA值做简单插补，平均数、中位数、众数。...a=1:1000 a[sample(a,100)]=NA dim(a)=c(20,50) a # 按照列，替换每一列的NA值为该列的平均值 b=apply(a,2,function(x){ x[is.na

3.5K2 0

【基础】R语言2：数据结构

数据类型数值型：用于直接计算加减乘除字符串型：可以进行连接，转换，提取等逻辑型：真或假日期型等R对象R语言中的变量可以赋值给变量的任何事物，包括常量、数据结构、函数甚至图形对象都拥有某种模式，描述此对象是如何储存的...var() #方差sd() #标准差prod() #连乘的积median() #计算中位数quantile(向量，c(0.4,0.5,0.8)) #分位数which(...,cnames)数组#创建数组dim(x)=c(2,2,5)矩阵的索引# 矩阵下标访问m[1,2]矩阵的计算#直接计算（矩阵之间行和列数要一致）m+1m+m#内置函数colsums() #每一列的和...x的不同值来求得 #labels：指定各水平的标签, 不指定时用各水平值的对应字符串 #exclude：指定要转换为缺失值(NA)的元素值集合 #ordered：取真值时表示因子水平是有次序的(按编码次序...对应元素分别为同一人的身高和性别， tapply()函数分男女两组计算了身高平均值

891 0

r语言求平均值_r语言计算中位数

先来看如何求平均值。...平均值是通过取数值的总和并除以数据序列中的值的数量来计算，函数mean()用于在R中计算平均值，语法如下： mean(x, trim = 0, na.rm = FALSE, ...)...如果缺少值，则平均函数返回NA，我们如果要从计算中删除缺少的值，可以使用na.rm = TRUE，这意味着删除NA值。...好啦，来综合看下实例：输出结果为：数据系列中的中间值被称为中位数，在R中使用median()函数来计算中位数，语法如下： median(x, na.rm = FALSE) 参数描述如下： x...na.rm – 用于从输入向量中删除缺少的值。众数是指给定的一组数据集合中出现次数最多的值，不同于平均值和中位数，众数可以同时具有数字和字符数据。

2.1K1 0

python数据分析——数据的选择和运算

代码和输出结果如下所示: （3）使用“how”参数合并关键技术：how参数指定如何确定结果表中包含哪些键。如果左表或右表中都没有出现组合键,则联接表中的值将为NA。...：四、数据运算 pandas中具有大量的数据计算函数,比如求计数、求和、求平均值、求最大值、最小值、中位数、众数、方差、标准差等。...进行非空值计数，此时应该如何处理?...关键技术:可以利用标签索引和count()方法来进行计数，程序代码如下所示：【例】对于上述数据集product_sales.csv,若需要特定的行进行非空值计数,应该如何处理？...关键技术: mean()函数能够对对数据的元素求算术平均值并返回,程序代码如下所示: 中位数运算 中位数又叫作中值,按顺序排列的一组数据中位于中间位置的数,其不受异常值的影响。

1251 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云