首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

一个函数全部搞定!

我看了一下,相关的统计参数: 最大 最小 极差 平均值 标准差 变异系数 我想,这个很容易,Excel就可以计算啊,但是作为R语言的用户,一定要用R语言解决才可以,所以我就写了一个函数,可以批量去生成多个性状的结果...参数的解释 「最大」 ❝最大,即为已知的数据中的最大的一个。一般可以通过排序比较求出。 ❞ 就是一列的性状,最大的那个,可以排序找到,也可以通过R语言的max函数实现。...「最小」 ❝最大,即为已知的数据中的最小的一个。一般可以通过排序比较求出。 ❞ 可以使用R语言的min函数实现。...「极差」 ❝极差又称范围误差或全距(Range),以R表示,是用来表示统计资料中的变异量数(measures of variation),其最大与最小之间的差距,即最大减最小后所得之数据。...然后使用apply函数,对数据框的列进行操作 最后返回汇总统计的结果 该函数的对象为一个由变量组成的数据框,数据类型都要是数值 4.

1.7K10

关于我只有基因和变异类型,还想做oncoplot(瀑布图)这件事!

当我只有基因和变异类型的时候,那就想办法整理成 excel的形式,然后使用ComplexHeatmap绘制。...二 数据转化 长型,宽型互转的方式有很多,可以使用tidyr包的gather ,spread函数进行长宽互转Tidyverse|tidyr数据重塑之gather,spread(长数据宽数据转化) ;也可以使用...2.1 使用reshape2包的dcast函数 #尝试转化 dcast <- dcast(data, gene~ sample) head(dcast) 和想象的好像有点不一样,是不是有很多问号❓...可以自定义成Exonic_Function使用逗号连接吗? 2.2 擅长使用R帮助 使用 ?...更多的优化调整方式,添加注释方式详见ComplexHeatmap|根据excel表绘制突变景观图(oncoplot) R 可视化的代码和例子很多,如何处理成可以用的 “输入文件” ,是件比较耗时 但是很核心的内容

1.3K20
您找到你想要的搜索结果了吗?
是的
没有找到

R语言进阶笔记4 | dplyr 汇总统计

一个函数全部搞定!),介绍R中编写一个函数,进行汇总统计。效果很不错。今天用tidyverse包实现一下,多角度尝试,然后尝试中学习。 1....相关的统计参数: 最大 最小 极差 平均值 标准差 变异系数 2. 模拟数据 首先,我模拟一个20行5列的数据框,每一列都是数值的数据类型。...<- as.data.frame(t(apply(dd, 2, func))) return(sm) } 「代码解释」 首先定义一个func的函数,里面包括最大,最小,极差,标准差,变异系数。...处理流程: 首先定义一个func函数,计算相关的汇总参数 使用summarise_if 函数,或者summarise_all函数,计算汇总统计 使用t()进行转置 使用as.data.frame进行格式转换...na.rm=T)) 「代码解释:」 使用group_by函数进行分组 使用summarise进行汇总统计,里面是不同的汇总统计参数 5.4 查看结果 > d1 %>% group_by(Trait)

99310

小数据| 描述性统计(PythonR 实现)

2.3 变异系数 变异系数实质上是标准差相对于算术平均值的大小 . 总体的变异系数计算公式为: ? 样本的变异系数计算公式为 : ?...因此, 如果比较算术平均值不同的两个数据集合的相对离散程度时, 使用变异系数要比使用标准差更具有说服力。此外, 变异系数是无单位指标, 这是它与其他离散程度指标最大的区别。...实现部分 介绍完了基本概念,下面使用Python 和 R 分别实现上述计算过程: Python实现 from numpy import mean,median,ptp,var,std import numpy...#整理成描述性统计的函数 my_describe <- function(x){ options(digits = 3) N = length(x); Min = min(x, na.rm...sapply(data, my_describe) 参考资料: 人人都会数据分析 数据分析|R-描述性统计

99620

如何使用R的sweep函数对表达矩阵进行标准化

做归一化的方法也很多,有根据中位数进行归一化,即将每个样本中所有基因的表达的中值转换到同一水平。...如下图所示 除了中位数标准化之外,我们还可以使用z-score的方法来对表达谱数据进行标准化: z-score=(表达量-均值)/标准差 那么下面小编就给大家演示一下如何使用前面讲到的☞R中的sweep...函数使用z-score的方法来对表达谱矩阵进行标准化 #为了保证随机数保持一致,这里设置一下种子序列 set.seed(123) #随机生成100个数,构造一个10X10的矩阵 data=matrix...data1=sweep(data,1,rowmean) #每一行基因表达除以这一行的标准差 data2=sweep(data1,1,rowsd,'/') data2 得到的结果如下 如果对R里面...t对表达矩阵做一个转置 #计算完再用t转置回来 data3=t(scale(t(data))) data3 得到的结果如下,有兴趣的小伙伴可以去对比一下跟使用sweep函数得到的结果。

1.2K10

R语言数据分析与挖掘(第五章):方差分析(1)——单因素方差分析

函数介绍 对于非正态分布的数据,一般采用Levenc检验法,且该检验同样适用于正态数据的检验。R中进行Levene检验的函数为leveneTest(),该函数包合在car 包中,使用前需要加载。...R中有多种方法实现方差分析,如利用函数aov()、anova()和onewey.test()进行分析,下面将对这些函数的具体用法进行详细介绍。...首先介绍函数oneway.test(),该函数的基本书写格式为: onexay.test(formula, data, subset, na.action, vat .equal=FALSE) 参数介绍...:一个向量,指定参数data中需要被包含在模型中的观测数据; Na.action: 一个函数,指定缺失数据的处理方法,若为NULL,则使用函数 na.omit()删除缺失数据; Var.equal:...综合案例:不同治疗方法下胆固醇降低效果的差异性分析 下面利用R语言包multcomp中数据集cholcsterol进行单因素方差分析,首次使用该包需要下载并加载: >install,packages (

4.8K31

生信代码:绘制基因组突变全景图

如果为TRUE,则选择基于顶级基因的变异(CNV或突变) significant 基因和对应的q作为侧边栏。...(当然你也考虑将数据可以转换为maf后再用maftools包绘图) ComplexHeatmap包也是一个超级强大的包,函数功能很多,今天则主要讲解该包如何绘制基因组突变全景图。...oncoprint(),先让我们来简单了解下这个函数 主要参数 用法 mat 用于画图的矩阵 get_type 如果在矩阵中将不同的突变编码为复杂的字符串,则此自定义函数将确定如何提取它们。...仅当mat是矩阵时才有效, 默认为default_get_type alter_fun 可以自定义不同的变异通过什么样子来进行显示。...maftools ComplexHeatmap 需要的文件格式 maf格式的文件 突变矩阵 画图主要函数 oncoplot() oncoPrint() 代码 相对简单 相对复杂(需要一定的R基础) 灵活度

5.9K41

数据处理第2节:将列转换为正确的形状

转换列:基础部分 您可以使用mutate()函数创建新列。 mutate中的选项几乎是无穷无尽的:你可以对普通向量做任何事情,可以在mutate()函数内完成。...我首先要使用mutate_all()搞砸了:下面的粘贴变异需要动态的函数。 你可以使用〜paste(。,“/ n”)或funs(paste(。,“/ n”))。...其次,它需要以函数形式的变异指令。 如果需要,请使用代字号或funs()之前(见上文)。...在这种情况下,您可以包装任何列的选择(使用select()函数内可能的所有选项)并将其包装在vars()中。 其次,它需要以函数形式的变异指令。 如果需要,请使用代字号或funs()之前(见上文)。...rows 将数据转换NA 函数na_if()将特定转换NA

8.1K30

R语言数据分析与挖掘(第八章):判别分析(3)——费歇尔(Fisher)判别分析

使得综合指标Z在A类的均数与B类的均数的差异尽可能大,而两类的类内综合指标的变异(S2A+S2B)尽可能小,也就是类间差异尽可能大,类内变异尽可能小,即使 ?...函数介绍 在R语言中,用与进行Fisher判别的最常用函数为lda(),该函数在包MASS中,有2种调用方式。...:指定可选向量,表示选择的样本子集; Na.action:一个函数,指定缺失数据的处理方法,若为NULL,则使用函数 na.omit()删除缺失数据。...:因子向量,用于指定样本属于哪一类; Subset:指定可选向量,表示选择的样本子集; Na.action:一个函数,指定缺失数据的处理方法,若为NULL,则使用函数na. omit()删除缺失数据...; Prior:指定各个类别的先验概率,默认为已有训练样本的计算结果; tol:控制精度,用于判断矩阵是否奇异; Method:字符串,用于指定估计方法,“mle”表示极大似然估计,“mve”表示使用

8.2K41

跟着存档教程动手学RNAseq分析(四):使用DESeq2进行DE分析的QC方法

img 注意:DESeq2文档建议大数据集(100个样本)使用方差稳定转换(vst)而不是rlog来进行计数转换,因为rlog函数可能运行太长时间,而vst()函数具有与rlog相似的属性,速度更快。...rlog函数返回一个DESeqTransform对象,另一种特定的DESeq的对象类型。你不只是得到一个转换后的的矩阵的原因是,计算rlog转换的所有参数(即大小因子)都存储在该对象中。...在这些情况下,vst()函数要快得多,并执行类似的转换,适合与plotPCA()一起使用。由于优化和转换的性质,使用vst()通常只需要几秒钟。...默认情况下,该函数使用前500个最可变的基因。您可以通过添加ntop参数并指定要使用多少个基因来绘制图表来改变这一点。 注意:plotPCA()函数将只返回PC1和PC2的。...注意:pheatmap函数有许多不同的参数,我们可以通过改变默认来增强图形的美观性。如果你感到好奇并想了解更多,请尝试运行下面的代码。你的图形是如何变化的?查看帮助页面(?

1.7K10

各种智能优化算法比较与实现(matlab版)

(促进和抑制抗体的产生:计算每个抗体的期望,抑制期望低于阈值的抗体;可以知道与抗原间具有的亲和力越高,该抗体的克隆数目越高,其变异率也越低) (6)进行免疫处理,包括免疫选择、克隆、变异和克隆抑制...首先使用蚁群算法、免疫算法和粒子群算法以第一个基准函数为例,画出适应度图像并据此分析每个函数的特点。本文用到的环境是Windows10系统,软件是MATLAB R2017a....这是一个有多个局部极值的函数,其函数图像如图所示: 2.1使用免疫算法求解函数极值 仿真过程如下设置: 第一步:初始化免疫个体维数为D=2,免疫种群个体数为NP=50,最大免疫代数为G=200,...2.2使用蚁群算法求解函数极值 仿真过程如下设置: 第一步:初始化蚂蚁个数m=20,最大迭代次数G=200,信息素蒸发系数Rh0=0.9,转移概率常数P0=0.2,局部搜索步长step=0.1 第二步...2.3使用粒子群算法求解函数极值 仿真过程如下设置: 第一步:初始化群体例子个数为N=100,粒子维数为D=2,最大迭代次数为T=200,学习因子c1=c2=1.5,惯性权重最大为Wmax=0.8,

2.3K20

通过R包cgdsr链接cbioportal来探索TCGA等公共数据

其实就173个有,所以需要去除NA。...这个 getProfileData 函数是万能的,后续如果我们要数量使用它来举例,基本上就是靠这一个函数即可。...miRNA,甲基化,蛋白)水平的预后(生存曲线) 8、探索各类肿瘤不同临床特征(性别、年龄、种族、临床分期)分组后的单个分子(mRNA,lncRNA,miRNA,甲基化,蛋白)特性的分布 下面我们就演示一下如何实现上面的需求...基因表达量高低分组的cox和连续变量cox回归计算的HR差异太大?...学徒作业-两个基因突变联合看生存效应 单个基因的表达量和拷贝数变异的关系探索 同样的使用getProfileData函数,去指定的文献里面,根据指定的样品列表,去获取指定的数据集信息 df = getProfileData

84421

【学习】《R实战》读书笔记(第四章)

图1:不同性别的领导行为 如何把图1的中数据导入R,对这些数据,我们有什么发现呢?...图3:R逻辑运算符号 基于逻辑运算符号关系来改变变量中内容,逻辑为真,则可以修改。 拓展可以了解within()函数和car包中的recode()函数。 重命名变量 重命名变量名,可以采用方法。...方法一:fix()函数。 方法二:包reshape中的rename()函数。 方法三:names()函数。 缺失 数据集往往是不完整,因为各种缘由存有缺失使用is.na()函数检查缺失。...x) [1] NA 可以使用na.omit()函数删除不完整的观察。...类型转换函数如图4所示: 图4:R类型转换函数 > rm(list=ls()) > a <- c(1,2,3) > a [1] 1 2 3 > is.numeric(a) [1] TRUE > is.vector

85450

人类胃癌(GC)器官特异性转移的转录异质性

使用自然对数转换(log(1+x))进行数据转换变异基因选择: 使用Seurat中的FindVariableGenes函数选择变异表达基因。...数据整合与缩放: 使用IntegrateData函数合并所有样本的数据。 通过ScaleData函数对整合后的数据进行缩放,以消除不想要的变异来源。...使用tSNE进行降维处理。 细胞聚类: 使用Seurat中的FindClusters函数进行细胞聚类。 通过表达典型标记基因来注释聚类。...恶性和非恶性评分:使用Seurat R包中的AddModuleScore函数,基于上述DEGs计算恶性评分和非恶性评分。...基因拷贝数变异(CNVs)分析: 使用CopyKAT工具分析了原发性肿瘤和转移灶中的基因拷贝数变异,基于基因组拷贝数轮廓识别出四个亚克隆(0-3)。

10310

R语言中的特殊及缺失NA的处理方法

通常来说,R语言中存在: NA NULL NaN Inf/-Inf 这四种数据类型在R中都有相应的函数用以判断。 NA NA即Not available,是一个长度为1的逻辑常数,通常代表缺失。...缺失NA的处理 理解完四种类型数值以后,我们来看看该采取什么方法来处理最常见的缺失NA。 小白学统计在推文《有缺失怎么办?系列之二:如何处理缺失》里说“处理缺失最好的方式是什么?...如数据框df共有1000行数据,有10行包含NA,不妨直接采用函数na.omit()来去掉带有NA的行,也可以使用tidyr包的drop_na()函数来指定去除哪一列的NA。...2.1 df[is.na(df)] df[is.na(df)] = 0 2.2 replace_na() 使用tidyr包的replace_na()函数。...replace_na(df$X1,5) # 把df的X1列中的NA填充为5 2.3 fill() 使用tidyr包的fill()函数将上/下一行的数值填充至选定列中NA

2.9K20
领券