首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【R语言】dplyr对数据分组取各组前几行

前面我们介绍过GO富集分析结果可视化 1.GOKEGG富集分析视频讲解 2.GO富集分析四种风格展示结果—柱形图,气泡图 3.GOKEGG富集结果如何显示基因symbol 4.GOKEGG...下面这张表就是GO富集分析得到的结果,我们可以根据ONTOLOGY这一列来分组,就可以得到BP,CCMF三个。然后取每一个的前10个条目或者前5个条目来绘制柱形图或者气泡图。...今天小编就跟大家分享一个专业处理数据框的函数dplyr。然后基于这个R包,我们用6种不同的方法来实现。...("dplyr") #加载dplyr包 library(dplyr) 我们先来看看直接head的效果 #直接head,结果不对 GO_result %>% group_by(ONTOLOGY) %>...top_n这个函数来输出每个的前五行,wt是排序的依据,根据校正之后的p值来排序,n=-5是按从小到大排序。

1.6K21
您找到你想要的搜索结果了吗?
是的
没有找到

数据分析:RT-qPCR分析及R语言绘图

数据归一化:由于qRT-PCR可能会受到实验操作和样本制备的影响,因此需要使用一个或多个内参基因(通常是表达水平相对稳定的基因)来归一化数据,以消除这些潜在的变异。...这里可以得到公式:计算 -ΔΔCt:内参基因分为对照处理内参基因先计算对照处理的内参基因Ct的均值: $$Mean_{内参基因}=mean(对照或处理内参基因)$$计算对照待检测目的基因减去对照内参基因的平均...sampleid % select(sampleid) # step1: 计算对照处理的内参基因平均值...(Sample_Name) %>% dplyr::summarise(CT_ref_mean = mean(CT)) # step2: 计算对照处理待检测目的基因减去对应分组的内参基因的平均...= control_group) %>% # group_by(Sample_Name, Target_Name) %>% # dplyr::summarise(Delta_CT_treat_mean

14510

R语言数据处理:飞机航行距离与到达延误时间有什么关系??

3.1 数据分组 dplyr包里的分组是由group_by()函数实现的,脚本输入代码: by_dest <- group_by(myFlights, destination) class(by_dest...) by_dest 由图可知,经分组后,一共有104数据,即本次分析的目的地有104个。...PS.这里穿插一个好用的工具,“管道”,即通过使用操作符把数据集名作为开头, 然后依次对此数据进行多步操作。...(%>%是最常用的一个操作符,就是把左侧准备的数据或表达式,传递给右侧的函数调用或表达式进行运行,可以连续操作就像一个链条一样。)...由上图,我们就可以初步分析航程延误时间并非线性关系,至于这种非线性关系该怎么解释,仍需进一步统计调查分析。

3K40

R语言ggplot2画图比较两连续型数据的几种方案

连续型数据的的分组比较在科研生活中非常常见,比如:实验对照基因表达量的比较、临床病人存活死亡某项检查指标的比较 等等。检验两连续型数据之间是否存在差异通常会使用T检验。...以下代码用到3个R语言包 分别是ggplot2 用来画图RColorBrewer 用来生成颜色dplyr 用来整理数据 ggplot2dplyr如果是第一次使用需要安装,安装用到的命令是 install.packages...image.png 接下来我们就来看看分别可以用哪些图来展示这样的数据 带误差线的柱形图 首先是对数据集进行转换 library(dplyr) df1<-summarise(group_by(data,...Status), mean(CRP)) df2<-summarise(group_by(data,Status), sd(CRP)) df3<-left_join(df1, df2) View(df3)...image.png 散点图用到的主要图形对象包括geom_jittergeom_dotplot. geom_jitter产生的点可在一定范围随机波动,所以也叫抖动点图;而geom_dotplot产生的点可以按照作者想要的方式

4.3K20

Day6生信入门—R包

下面以dplyr为例,学习R包 安装和加载R包 初级模式 通过options()$repos检验 升级模式 为了保证可以自定义CRANBioconductor的下载镜像,只需要运行这两行代码即可:..., 结合 group_by 使用实用性强 summarise(test, mean(Sepal.Length), sd(Sepal.Length))# 计算Sepal.Length的平均值标准差 先按照...Species分组,计算每组Sepal.Length的平均值标准差: group_by(test, Species) summarise(group_by(test, Species),mean(Sepal.Length...), sd(Sepal.Length)) 图片 # dplyr两个实用技能 ## 1:管道操作 %>% (cmd/ctr + shift + M) (加载任意一个tidyverse包即可用管道符号) test...连inner_join,取交集 inner_join(test1, test2, by = "x") ## 2.左连left_join left_join(test1, test2, by = 'x'

42320

Day6——R包

BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") install.packages("dplyr")library(dplyr)dplyr五个基础函数示例数据...Sepal.Length大于5的行filter(test, Species %in% c("setosa","versicolor"))#选择物种名为setosa","versicolor的行#%in%判断前面一个向量的元素是否在后面一个向量中...,结合group_by使用实用性强summarise(test, mean(Sepal.Length), sd(Sepal.Length))# 计算Sepal.Length的平均值标准差group_by...Sepal.Length的平均值标准差dplyr两个实用技能管道操作 %>%加载任意一个tidyverse包即可用管道符号#%>% (向右操作符,forward-pipe operator),就是把左侧准备的数据或表达式...,传递给右侧的函数调用或表达式进行运行,可以连续操作就像一个链条一样。

13810

R语言学习 - 柱状图

柱子有点多,也可以利用mean±SD的形式展现 首先计算平均值标准差,使用group_by按gene分组,对每组做summarize # 获取平均值标准差 data_m_sd_mean % group_by(gene) %>% dplyr::summarise(sd=sd(value), value=mean(value)) data_m_sd_mean <- as.data.frame...在柱子中标记百分比值 首先计算百分比,同样是group_by (按照给定的变量分组,然后按操作)mutate两个函数(在当前数据表增加新变量) # group_by: 按照给定的变量分组,然后按操作...# mutate: 在当前数据表增加新变量 # 第一步增加每个的加,第二步计算比例 data_m % group_by(variable) %>% mutate(count...: 按照给定的变量分组,然后按操作 # mutate: 在当前数据表增加新变量 # 第一步增加每个 (GroupCondition共同定义分组)的加,第二步计算比例 data_m <- data_m

2.5K50

「R」dplyr 行式计算

「原文来自:dplyr 文档」 上一篇:「R」dplyr 列式计算 通常 dplyr R 更适合对列进行操作,而对行操作则显得更麻烦。...按行汇总统计 dplyr::summarise() 让一列多行的统计汇总变得非常简单,当它与 rowwise() 结合时,它也可以简便地操作汇总一行多列。...分组数据框(每个恰好有一行)行数据框(每个总是有一行)之间有一个重要的区别。...do() 我们对 do()的必要性已经质疑了很长一段时间,因为它与其他 dplyr 动词并不太相似。它有两种主要的运作模式: 没有参数名:你可以调用函数来输入输出数据框。引用“当前”。...例如,下面的代码获取每个的第一行: mtcars %>% group_by(cyl) %>% do(head(., 1)) #> # A tibble: 3 x 13 #> # Groups

6.2K20

Day6-R包

今天的内容在我刚看到的时候,觉得很难,看不懂每一步代码的意思,不知道是如何得到花花老师的结果的,但是在自己一步一步按照教程来进行操作,仔细比对前后的变化的时候,我对dplry包的使用有了更清晰的认识,这一部分内容需要自己多多练习...),排序arrange(test,Sepal.Length)arrange(test,desc(Sepal.Length))# 5.summarise():汇总# 计算Sepal.Length的平均值标准差...summarise(test, mean(Sepal.Length), sd(Sepal.Length))# 先按照Species分组,计算每组Sepal.Length的平均值标准差group_by(...test,Species)summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))# 管道操作%>%test %>%...<- data.frame(x=c('a','b','c','d','e','f'), y=c(1,2,3,4,5,6))test2# 1.inner_join连接

9910
领券