首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

R语言之数值型描述分析

对于数值型变量,如 age、lwt、plt、ftv 和 bwt,函数 summary( )给出最小值、下四分位数、中位数、均值、上四分位数和最大值;对于分类变量,如 low、race、smoke、ht...epiDisplay 包的函数 summ( )作用于数据框可以得到另一种格式的汇总输出,它将变量行排列,把最小值和最大值放在最后两列以方便查看数据的全距。...psych 包里的函数 describe( )可以计算变量忽略缺失值后的样本量、均值、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、全距、偏度、峰度和均值的标准误等。...birthwt$race), mean) 这里的分类变量有 2 个,其中 smoke 有 2 个类别,race 有 3 个类别,上面的命令按照这两个变量各类别的所有组合(共 6 )...实际上,在第 3 章介绍的 dplyr 包里的函数 group_by( )和 summarise( )就能非常灵活地计算分组统计量。

18220

dpois函数_frequency函数

这会将分析单位从完整数据集更改为单个。当在分组数据框上使用dplyr时,它们将自动“”应用。...可以将其作为一系列命令性语句阅读:,然后汇总,然后过滤。 正如本文所述,在阅读代码时%>%意味着“然后”。...此图的形状非常有特色:无论何时绘制平均值(或其他摘要)与大小,都会看到随着样本量的增加,变化会减小。...在查看此类图时,过滤掉具有最少观察数的通常很有用,因此可以看到更多的模式,而不是最小组中的极端变化。这就是下面的代码所做的,并向您展示了将ggplot2集成到dplyr流中的便捷模式。...换句话说,分组总和的总和是总和,但分组中位数中位数不是总体中位数。 5.6.6 取消组合 如果需要删除分组,并返回对未分组数据的操作,使用ungroup()。

1.8K10

箱线图的生物学含义

# 安装datasauRus的R扩展包 install.packages("datasauRus") # 加载R包 library(datasauRus) if(requireNamespace("dplyr...")){ suppressPackageStartupMessages(library(dplyr)) datasaurus_dozen %>% group_by(dataset) %...数据分布动态变换图 三、如何绘制箱线图 1.一些描述统计学概念 平均值,方差,最大值,最小值这些应该很熟悉,主要介绍一下中位数和四分位数的概念。 中位数:就是样本排序后,最中间的那个数了。...如果样本数是奇数,那么中间的数只有一个就是中位数,如果样本数是偶数,那么取中间两个值的平均数就是他们的中位数) 四分位数:实际上就是把数据集分成四等份,要把一个苹果切成四块,需要几刀?答案是三。...以转录中最常见到的表达矩阵为例,有的基因的表达丰度上千,有的基因几乎不表达,甚至接近于零,这些从数据本身也很容易看出。

3.9K60

UseGalaxy.cn生信云|零代码使用Tiverse优雅地处理数据集

TIDYVERSE Dplyr Arrange rows Dplyr Count the observations Dplyr Distinct keep unique rows Dplyr Join...two tables Dplyr Join with one varibale Dplyr Mutate create, modify, and delete columns Dplyr Rename...columns Dplyr Select keep or drop columns Dplyr Slice select rows by position Dplyr Filter keep rows...Dplyr Count the observations count 函数用于统计数据框中各个的频数,可以对指定变量进行计数,得到每个类别的观测数目,支持根据需要对结果进行排序。...Dplyr Slice select rows by position slice 函数用于行数进行切片,能够从数据框中提取特定的行,支持根据行数或行号选择需要的行,也支持使用负数表示从末尾开始计算的行数

15320
领券