首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

RNA-seq入门实战(三):在R里面整理表达量counts矩阵

他前面的分享是: Counts FPKM RPKM TPM CPM 的转化 获取基因有效长度的N种 下面是他对我们b站转录视频课程的详细笔记 本节概览: 从featureCounts输出文件中获取...一般为了对样品进行分组注释我们还需要在GEO网站下载样品Metadata信息表SraRunTable.txt,接下来就需要在R中对输出结果进行操作,转化为我们想要的基因表达counts矩阵。...image.png 一、从featureCounts输出文件中获取counts矩阵 1....) # ggplot2 stringer dplyr tidyr readr purrr tibble forcats library(data.table) #多核读取文件 setwd("C:/Users...基因ID转换 若上游中采用的是UCSC的基因和gtf注释文件,则表达矩阵行名就是我们常见的gene symbol基因名;若上游采用的是gencode或ensembl基因和gtf注释文件,那么我们就需要将基因表达矩阵行名的

15.5K45

Hadley Wickham 采访节选(二)

purrr的设计目的并不是说要实现base R中无法实现的功能,只是base R中的这些底层函数使用起来太不方便而且容易出错,而purrr则用一种统一、安全的方式去重新打包了这些函数。...但是话说回来,在我最近写的包里面,我都尽量不使用purrr。 (purrr包的logo) ? “ 等等,你为什么不愿意在你最近写的这个包里面用purrr呢?...最近我不是在开发Bigrquiry这个包嘛(大猫:一个使用R从Google BigQuiry提取数据的API),我发现如果我用了purrr,那么我就很难避免不用dplyr,因为purrr严重依赖dplyr...,而dplyr又依赖其他的东西。...但是平时的工作我几乎全都用R,一面因为R完全满足我现在的工作需要;另一面我对R太熟悉了,用R解决问题要远远快于其他语言。有时候解决完一个问题,顺带一个R包就写好了,这样刚好可以造福他人。

67920

rdplyr 里的 join 与 base 里的 merge 存在差异

今天在使用连接操作时发现:虽然都是合并操作函数,dplyr 包里的 *_join() 和基础包里面的 merge() 存在差异,不同的数据结构,结果也会存在偏差。...purrr::reduce(x, dplyr::full_join) #> Joining, by = "r1" #> Error: `by` must be supplied when `x` and...所以使用 dplyr 提供的连接函数报错是正常的,但有意思的是,基础包提供的 merge() 函数可以完成连接操作,真是优秀(感兴趣的朋友可以看下测试下 merge 函数源代码)!...如果 be_join 不为空,进行如下的循环: 如果存在,则将这个子集和 to_join 共同列合并 如果不存在,使用循环位移一位,将当前 be_join 的第 2 个子集移动为 第 1 个。...2 S1 S2 S2 S1 S2 更新 在后面的一些使用过程中发现基础包的 merge() 函数在进行连接操作时会输出有问题的结果,所以建议使用的小伙伴仔细检查结果。

1.5K30

R」用purrr实现迭代

迭代方式主要有两种: 命令式编程 - for和while 函数式编程 - purrr 准备工作 purrr是tidyverse的核心r包之一,提供了一些更加强大的编程工具。...接下来我们将学习和使用purrr包,它提供的函数可以替代很多常见的for循环应用。R基础包中的apply应用函数族也可以完成类似的任务,但purrr包的函数更一致,也更容易学习。...每种类型的输出都有一个相应的函数: map()用于输出列表 map_lgl()用于输出逻辑型向量 map_dbl()用于输出双精度型向量 map_chr()用于输出字符型向量 每个函数都使用一个向量(注意列表可以作为递归向量看待...当检查多个模型时,有时候我们需要提取像R这样的摘要统计量,要想完成这个任务,我们需要先运行summary()函数,然后提取结果中的r.squared: models %>% map(summary...$r.squared) #> 4 6 8 #> 0.509 0.465 0.423 因为提取命名成分操作非常普遍,所以purrr提供了一种更简单的快捷方式:使用字符串。

4.8K20

tidyverse

背景 Tidyverse 是 Rstudio 公司推出的专门使用 R 进行数据分析的一整套工具集合,里面包括了readr,tidyr, dplyrpurrr,tibble,stringr...《R 数据科学》电子书:https://r4ds.had.co.nz/ tidyverse 包重构了 R 语言处理数据的语法,比默认的 R 函数更加方便,相当于一套新的语法,使用起来更加方便...tidyr 与 dplyr 包是用 R 语言中用来处理各种数据整合分析的包,可以说是 R 数据整合的“瑞士军刀”,tidyr 包负责将数据重新整合,dplyr 包可以完成数据的排序,筛选,分类计算等都等操作...tidyr 之前的版本主要包含以下几个重要函数: gather:宽数据变成长数据; spread:长数据变成宽数据; unite:将多列指定分隔符合并为一列...在矩阵中,若数值为 0的元素数目远远多于非0元素的数目,并且非 0元素分布没有规律时,则称该矩阵为稀疏矩阵;与之相反,若非 0 元素数目占大多数时,则称该矩阵为稠密矩阵

1.6K10

Rdplyr 行式计算

「原文来自:dplyr 文档」 上一篇:「Rdplyr 列式计算 通常 dplyrR 更适合对列进行操作,而对行操作则显得更麻烦。...这篇文章,我们将学习围绕rowwise() 创建的 row-wise 数据框的 dplyr 操作方法。 本文将讨论 3 种常见的使用案例: 行聚合(例如,计算 x, y, z 的均值)。...行汇总统计 dplyr::summarise() 让一列多行的统计汇总变得非常简单,当它与 rowwise() 结合时,它也可以简便地操作汇总一行多列。...现在我们有了三行(每个一行),还有一个列表列 data,用于存储该的数据。还要注意输出是 rowwwise();这一点很重要,因为它将使处理数据框列表变得更加容易。...do() 我们对 do()的必要性已经质疑了很长一段时间,因为它与其他 dplyr 动词并不太相似。它有两种主要的运作模式: 没有参数名:你可以调用函数来输入和输出数据框。引用“当前”

6.2K20

ggstatsplot:R统计绘图的颜值天花板

ggstatsplot和它的后台组件还可以和其他基于ggplot2的R包结合起来使用。...01 — 安装与基本介绍 绘图类型统计 函数 作图类型 描述 ggbetweenstats 小提琴图 /条件间的比较 ggwithinstats 小提琴图 /条件内的比较 gghistostats...ggpiestats 饼状图 分类数据 ggbarstats 条形图 分类数据 ggcoefstats 点线图 回归模型和元分析 安装 要获得最新的稳定CRAN版本: ##下载安装### install.packages...title.prefix = "Movie genre", plotgrid.args = list(nrow = 2) ) (6)ggpiestats 该函数用于绘制饼状图,并将列联表分析(受试者间设计的皮尔逊检验和受试者内设计的麦克内马检验...如果只输入一个类别变量,单样本比例检验(即拟合优度检验)的结果将显示为副标题。

2.1K20

R||R语言基础(三)_R

今天继续学习R语言基础的R使用,以R包:dplyr为例 数据准备 01 R包的安装 install.packages(“dplyr”) 或BiocManager::install(“dplyr”)...#务必要打引号 02 R包的调用/加载 library(dplyr) 或require(dplyr) #这里不用引号 部分人可能会因为镜像的问题失败,解决方法https://mp.weixin.qq.com.../s/XvKb5FjAGM6gYsxTw3tcWw 03 R包及数据准备 install.packages("dplyr") library(dplyr) test <- iris[c(1:2,51:52,101...其核心包有ggplot、readr、tibble、purrr、 tidyr 、dplyr、ggplot、forcats 和stringr8个. 我们这里用的是dplyr包,因此可以使用管道。...inner_join(test1, test2, by = "x") 2.left_join 以左边的为基准 3.full_join 全部连接 因为这里只有x是共同列,所以是否有by='x'对输出无影响

3.3K50

DESeq2差异表达分析

打开RStudio并创建一个名为“DE_Analysis_scrnaseq”的新R项目。...要了解有关DESeq2法和分析步骤解构的更多信息,可参考(https://hbctraining.github.io/DGE_workshop_salmon/schedule/)。...这个聚合的输出是一个稀疏矩阵,当我们快速查看时,我们可以看到它是一个基于细胞类型的基因-样本矩阵。 例如,在B细胞中,样本 ctrl101 的NOC2L基因有12个相关计数。...我们需要做以下几个步骤: 细胞类型拆分数据 变换矩阵,使基因成为行名,样本成为列名 我们将细胞类型划分数据;但是,并非所有样本都包含每种细胞类型的细胞。...从向量中提取B细胞: clusters[1] 我们可以使用输出对B细胞运行DE分析。首先,我们可以仅将元数据和计数设置为B细胞。

5.4K33

学习R语言,一篇文章让你从懵圈到入门

R和python上都可使用 readr:实现表格数据的快速导入。...,以便于你后续建模分析: tidyr:用于整理表格数据的布局 dplyr:用于将多个数据表连接成一个整齐的数据集 purrr:函数式编程工具,在做数据整理时非常有用。...dplyr:一个用于高效数据清理的R包。...purrr:一个用于 提供函数式编程方法的工具 profvis:用于可视化R代码的性能分析数据 Rcpp:用于实现R与C++的无缝整合。...:提供了一个执行非负矩阵分解的算法和框架 crayon:用于在输出终端添加颜色 RJSONIO:rjson是一个R语言与json进行转的包,是一个非常简单的包,支持用 C类库转型和R语言本身转型两种方式

3.7K40

学习R语言,一篇文章让你从懵圈到入门

R和python上都可使用 readr:实现表格数据的快速导入。...,以便于你后续建模分析: tidyr:用于整理表格数据的布局 dplyr:用于将多个数据表连接成一个整齐的数据集 purrr:函数式编程工具,在做数据整理时非常有用...dplyr:一个用于高效数据清理的R包。...purrr:一个用于 提供函数式编程方法的工具 profvis:用于可视化R代码的性能分析数据 Rcpp:用于实现R与C++的无缝整合。...:提供了一个执行非负矩阵分解的算法和框架 crayon:用于在输出终端添加颜色 RJSONIO:rjson是一个R语言与json进行转的包,是一个非常简单的包,支持用 C类库转型和R语言本身转型两种方式

4K31

一步解决R中中文字符问题

❝今天会员交流群内有朋友询问图片预览遇到问题该如何解决,本节就来详细介绍一下R中图形预览及导出会遇到的问题,个人观点仅供参考。...❞ 软件版本信息 R version 4.3.3 (2024-02-29) -- "Angel Food Cake" Copyright (C) 2024 The R Foundation for Statistical...✔ stringr 1.5.1 ✔ ggplot2 3.5.0 ✔ tibble 3.2.1 ✔ lubridate 1.9.3 ✔ tidyr 1.3.1 ✔ purrr...❝Cairo是R中的一个包,用于创建向量图形(如PDF、SVG)和位图图形(如PNG、BMP、GIF、JPEG)。它基于Cairo图形库,该库是一个跨平台的图形API,支持多种输出设备。...以上操作为Macos系统 windows系统则需要在代码中使用showtext包进行字体渲染,若不进行渲染则导出pdf时字体会乱码 install.packages("showtext") library

25310
领券