在往期内容中,我已经和大家讲解了t检验和方差分析(ANOVA)在R语言中如何实现,这里需要注意:使用t检验和方差分析时,需要样本服从正态分布,并且方差齐性,或者经过变量变换后服从正态分布和方差齐性。但是如果我们的数据无论经过怎样的变量变换都达不到正态分布或方差齐性的要求,那么我们就需要使用基于秩次的非参数假设检验,非参数检验主要针对非正态样本,其统计效力会比带参数的假设检验要弱一些。
之前详细介绍了利用R语言进行统计描述,详情点击:R语言系列第三期:③R语言表格及其图形展示、R语言系列第三期:①R语言单组汇总及图形展示、R语言系列第三期:②R语言多组汇总及图形展示
相关系数可以用来描述定量变量之间的关系。相关系数的符号(±)表明关系的方向(正相关或负相关),其值的大小表示关系的强弱程度(完全不相关时为0,完全相关时为1)。除了基础安装以外,我们还将使用psych和ggm包。
一、正态分布参数检验 例1. 某种原件的寿命X(以小时计)服从正态分布N(μ, σ)其中μ, σ2均未知。现测得16只元件的寿命如下: 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 问是否有理由认为元件的平均寿命大于255小时? 解:按题意,需检验 H0: μ ≤ 225 H1: μ > 225
前面八章介绍了R软件的基础知识,这些知识都是零碎的操作与处理,虽然不能处理一个完整的实际案例,但却非常重要,接下来,主要讲数据挖掘中处理实际案例之前,所需要的一些模型和功能,我们先从传统的统计学开始,
统计学一直是让医学生头疼的课程,文章中各式各样的统计方法让人云里雾里。举个简单的例子,两组之间的比较,该怎么分析?你肯跟会说用t检验,不过t检验一定是正确的吗?是否方差齐性,是否正态分布,这些都是我们要关心的,如果方差不齐,我们该怎么办?如果有很多分组,我们两两之间必要,也要花费很多的时间。那有没有什么快速、高效、准确的方法,能够让我们快速准确绘制统计检验的图形呢?哈哈,今天我们就来学习一下如何用最快最简单的方式完成统计检验和绘制发表级的图片吧!
定性资料比如等级,毒性,应答等,可以以具有分级的因子的形式表示,比如(+ ++, +++),分别对应因子的1,2,3种水平,这样不同组样本只要看这些数据的等级的排列是否一致就可以判断这两个群体的分布是否有差异(秩和检验)。
#基本统计分析 #整体描述性统计分析,针对数值变量 attach(mtcars) opar = par(no.readnoly=TRUE) d = mtcars[c("mpg","hp","wt")] head(d) #summary #较标准正态分布呈现正偏,且较平。(偏度为正,峰度为负) summary(d) plot(density(mpg)) #describe #多了峰度,偏度等数据 library(psych) describe(d) #分组描述统计,针对数值变量 #aggregate,f
通常先用 lm() 函数对数据建立线性模型,再用 anova() 函数提取方差分析的信息更方便。
比如研究血型与性格是否独立,如果性格a的血型比例与性格b的血型比例相同,那么统计上独立。
因为书中列举的方法和知识点比较多,没必要全都掌握,会一种,其他的了解即可。我就简要地整理一下我觉得重要的吧。
箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用。
第三单元第十二+十三讲:使用作者代码重复结果 课程链接在:http://jm.grazy.cn/index/mulitcourse/detail.html?cid=53 这一篇会是代码密集型,因为原文
在生物领域我们常常使用R语言对数据可视化。在对数据可视化的时候,我们需要明确想要展示的信息,从而选择最为合适的图突出该信息。本系列文章将介绍多种基于不同R包的作图方法,希望能够帮助到各位读者。
R 语言在统计分析方面起了很大的作用,并且其开开放性更是促进了大量分析R包的出现。今天我们就不一一去列举相关的R包,而是总结一下R语言自带的统计学函数。 一、统计学数据的生成函数: norm 正态分布 f F分布 unif 均匀分布 cauchy 柯西分布 binom 二项分布 geom 几何分布 diag 对角阵 二、基础的运算函数 abs 绝对值 sqrt 平方根 exp e^x次方 log 自然对数 log2,log10 其他对数 sin,cos,tan 三角函数 sinh,cosh,tanh 双曲
最近一段时间的R语言学习笔记,以便于自己学习之用,特记录在博客中,感兴趣的人还可以看看。记录的东西也不一定正确,请大家指教,里面可能会引用到一些别人的资料等,作为学习之用 读书笔记 相关的函数记录与整理 1、source("文件名.r"):调取主程序的文件,在程序结构复杂的时候很有用,可以将一部分复杂的运算主程序放入其中。 2、install.packages("fields"):安装程序包 3、library(fields):导入程序包 4、t(x)转置函数,对于csv中横排的转置很有用 5、dev.o
到目前为止,R语言的数据操作和基础绘图部分已经讲解完毕,换句话说,大家应该已经能将数据导入R中,并运用各种函数处理数据使其成为可用的格式,然后将数据用各种基础图形展示。完成前面这些步骤之后,我们接下来要探索数据中变量的分布以及各组变量之间的关系。
help() 或者 ? + command 这是学习和使用R最常用到的命令。 help.search() 或者?? 搜索包含制定字串或pattern的命令 R.Version() 查看
背景介绍 如果是bulk RNA-seq,那么现在最流行的就是DESeq2 和 edgeR啦,而且有很多经过了RT-qPCR 验证过的真实测序数据可以来评价不同的差异基因算法的表现。 对单细胞测序数据来说,通常需要先聚类之后把细胞群体进行分组,然后来比较不同的组的差异表达情况。当然,也有不少单细胞测序实验设计本身就有时间点,不同个体来源,不同培养条件这样的分组! 同时还有不少方法是不需要预先分类的,因为分类本身就会引入偏差。 跟bulk RNA-seq不一样的地方是,scRNA-seq通常涉及到的样本数量更
领取专属 10元无门槛券
手把手带您无忧上云