首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

R语言之数值型描述分析

对于数值型变量,如 age、lwt、plt、ftv 和 bwt,函数 summary( )给出最小值、下四分位数、中位数、均值、上四分位数和最大值;对于分类变量,如 low、race、smoke、ht...epiDisplay 包的函数 summ( )作用于数据框可以得到另一种格式的汇总输出,它将变量行排列,把最小值和最大值放在最后两列以方便查看数据的全距。...psych 包里的函数 describe( )可以计算变量忽略缺失值后的样本量、均值、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、全距、偏度、峰度和均值的标准误等。...birthwt$race), mean) 这里的分类变量有 2 个,其中 smoke 有 2 个类别,race 有 3 个类别,上面的命令按照这两个变量各类别的所有组合(共 6 )...实际上,在第 3 章介绍的 dplyr 包里的函数 group_by( )和 summarise( )就能非常灵活地计算分组统计量。

18820

dpois函数_frequency函数

这会将分析单位从完整数据集更改为单个。当在分组数据框上使用dplyr时,它们将自动“”应用。...可以将其作为一系列命令性语句阅读:,然后汇总,然后过滤。 正如本文所述,在阅读代码时%>%意味着“然后”。...此图的形状非常有特色:无论何时绘制平均值(或其他摘要)与大小,都会看到随着样本量的增加,变化会减小。...在查看此类图时,过滤掉具有最少观察数的通常很有用,因此可以看到更多的模式,而不是最小组中的极端变化。这就是下面的代码所做的,并向您展示了将ggplot2集成到dplyr流中的便捷模式。...换句话说,分组总和的总和是总和,但分组中位数中位数不是总体中位数。 5.6.6 取消组合 如果需要删除分组,并返回对未分组数据的操作,使用ungroup()。

1.8K10

箱线图的生物学含义

# 安装datasauRus的R扩展包 install.packages("datasauRus") # 加载R包 library(datasauRus) if(requireNamespace("dplyr...")){ suppressPackageStartupMessages(library(dplyr)) datasaurus_dozen %>% group_by(dataset) %...数据分布动态变换图 三、如何绘制箱线图 1.一些描述统计学概念 平均值,方差,最大值,最小值这些应该很熟悉,主要介绍一下中位数和四分位数的概念。 中位数:就是样本排序后,最中间的那个数了。...如果样本数是奇数,那么中间的数只有一个就是中位数,如果样本数是偶数,那么取中间两个值的平均数就是他们的中位数) 四分位数:实际上就是把数据集分成四等份,要把一个苹果切成四块,需要几刀?答案是三。...以转录中最常见到的表达矩阵为例,有的基因的表达丰度上千,有的基因几乎不表达,甚至接近于零,这些从数据本身也很容易看出。

3.9K60

R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)

R语言︱数据集分组 大型数据集通常是高度结构化的,结构使得我们可以不同的方式分组,有时候我们需要关注单个的数据片断,有时需要聚合不同组内的信息,并相互比较。...二、数据分组以及分组汇总 1、cut函数 b<- cut(a, 5,labels=F) #将数据平均分成5,rank=5代表大,rank=1代表小 2、aggregate函数——分组汇总 ?...##按照已有的类别数据,分类 g<-split(Cars93,Cars93$Origin) #按照cars93数据集,按照origin进行分组 ##例2:对矩阵分组(列) m<-cbind...1 2 [6,] 1 2 [7,] 1 2 [8,] 1 2 [9,] 1 2 [10,] 1 2 ##后续处理 ##计算的长度和内均值...在base包里和split功能接近的函数有cut(对属性数据分划),strsplit(对字符串分划)以及subset(对向量,矩阵或数据框给定条件取子集)等。

20.5K32
领券