如何使用dplyr在行组之间进行划分_如何在不列出变量的情况下使用dplyr在行组之间划分变量？_使用`dplyr`按组划分行 - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

RFM模型及R语言实现

根据美国数据库营销研究所Arthur Hughes的研究，客户数据库中有三个神奇的要素，这三个要素构成了数据分析最好的指标：最近一次消费(Recency)、消费频率(Frequency)、消费金额(Monetary)。

一篇小短文助你打开数据可视化的任督二脉！

本文主要讨论ggplot2是如何通过颜色信号来对多边形进行填充的底层理念，这也是想要进阶R语言数据可视化过程中必须搞明白的关键环节。 ggplot2所有图层对象中，geom_ploygon（）几何图层对象最为复杂，也最为特殊：复杂在哪儿呢？这种几何对象所定义的多边形（特别是在地理信息数据里面），领土边界是基于行政区划、行政区划再细分为单个多边形（也就是group），单个多边形又是一组经纬度坐标点构成（按照order排序）。所以说geom_ploygon()所要显式声明的参数至少需要四个： data(地

「R」使用gt包创建表格

空间转录组共定位展示分析图

The Innovation | clusterProfiler：聚焦海量组学数据核心生物学意义

clusterProfiler4.0同步支持最新版GO和KEGG数据，支持数千物种的功能分析，应对不同来源的基因功能注释（如cell markers, COVID-19等）提供了通用的分析方法，适用各类组学数据（RNA-seq, ChIP-seq, Methyl-seq, scRNA-seq…）。新版本尤其实现多组数据间自由比较，如不同条件、处理等，并内置系列流行辅助工具，如数据处理包dplyr、可视化包ggplot2等，方便分析人员用熟悉的方式自由探索，实现数据高效解读。

单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析19

单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析1：https://cloud.tencent.com/developer/article/2055573

RNA-seq 详细教程：注释（15）

R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)

大型数据集通常是高度结构化的，结构使得我们可以按不同的方式分组，有时候我们需要关注单个组的数据片断，有时需要聚合不同组内的信息，并相互比较。

单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析3

单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析1：https://cloud.tencent.com/developer/article/2055573

整合单细胞和空转数据多种方法之CellTrek

CellTrek发表于2022年的Nature Biotechnology，题为《Spatial charting of single-cell transcriptomes in tissues》。CellTrek可以结合单细胞和空间转录组数据准确地定位组织内单个细胞的位置，并构建空间细胞图谱。gitHub在https://github.com/navinlabcode/CellTrek

左手用R右手Python系列8——数据去重与缺失值处理

因为最近事情略多，最近更新的不勤了，但是学习的脚步不能停，一旦停下来，有些路就白走了，今天就盘点一下R语言和Python中常用于处理重复值、缺失值的函数。在R语言中，涉及到数据去重与缺失值处理的函数一共有下面这么几个： unique distinct intersect union duplicated #布尔判断 is.na()/!is.na() #缺/非缺失值 na.rm=TRUE/FALSE #移除缺失值 na.omit(lc) #忽略缺失值 complete.

上手即用，分组统计检验直方图的绘图脚本分享

发文章，写论文，分组统计检验直方图是最常见和最实用的，你是否还在烦恼如果把图画好，帮你解决困难啦！这里分享下同事新鲜写就的绘图脚本，自带了示例数据，可以一键出图，助力你的科研和学习。

R语言数据处理：飞机航行距离与到达延误时间有什么关系??

数据分析有一半以上的时间会花在对原始数据的整理及变换上，包括选取特定的分析变量、汇总并筛选满足条件的数据、排序、加工处理原始变量并生成新的变量、以及分组汇总数据等等。这一点，我想大部分使用EXCEL的童鞋都深有体会，写论文时，这么多的数据进行处理，手动汇总、筛选、变换，工作量实在是太大。而本文介绍的dplyr包简直就是Hadley Wickham （ggplot2包的作者，被称作“一个改变R的人”）大神为我们提供的“数据再加工”神器啊。本文试图通过一个案例，对神奇的dplyr包的一些常用功能做简要介绍

「R」Robust Rank Aggregation 算法介绍

那么要怎么根据手上的三组数据来获得一个相对可靠的排名来进一步确定要研究的对象呢？排名整合就可以帮助处理这种问题。

ggplot2散点图直方图条形图

熟悉ggplot2绘图，有一本书，可以介绍大家使用，《R数据可视化手册》第二版

「R」ggplot结合点图与箱线图的问题与解决

最近在使用ggplot2对箱线图叠加点图是发现奇怪的现象，只要我改变点的形状，绘图就出问题了。

R语言学习 - 柱状图

柱状图绘制柱状图也是较为常见的一种数据展示方式，可以展示基因的表达量，也可以展示GO富集分析结果，基因注释数据等。常规矩阵柱状图绘制有如下4个基因在5组样品中的表达值 data_ori <- "Grp_1;Grp_2;Grp_3;Grp_4;Grp_5 a;2.6;2.9;2.1;2.0;2.2 b;20.8;9.8;7.0;3.7;19.2 c;10.0;11.0;9.2;12.4;9.6 d;9;3.3;10.3;11.1;10" data <- read.table(text=data_ori

R语言学习笔记之——数据处理神器data.table

数据处理在数据分析流程中的地位相信大家都有目共睹，也是每一个数据从业者面临的最为繁重的工作任务。在实际应用场景下，虽然SQL（SQL类专业的etl语言）是数据处理的首选明星语言，性能佳、效率高、容易培养数据思维，但是SQL没法处理构建全流程的数据任务，之后仍然需要借助其他数据分析工具来对接更为深入的分析任务。 R语言作为专业的统计计算语言，数据处理是其一大特色功能，事实上每一个处理任务在R语言中都有着不止一套解决方案（这通常也是初学者在入门R语言时，感觉内容太多无从下手的原因），当然这些不同方案确实存在

SPOTlight || 用NMF解卷积空间表达数据

Giotto|| 空间表达数据分析工具箱 Seurat 新版教程：分析空间转录组数据(上) Seurat 新版教程：分析空间转录组数据(下) scanpy教程：空间转录组数据分析 10X Visium:空间转录组样本制备到数据分析空间信息在空间转录组中的运用定量免疫浸润在单细胞研究中的应用

单细胞转录组 | 数据降维

假设一共1000个细胞，每个细胞只有一个基因（基因Ⅰ）的表达，那么这些细胞会分布在以基因Ⅰ为x轴的一维坐标轴上；如果每个细胞有两个基因（基因Ⅰ、基因Ⅱ）表达，那么这些细胞会分布在以基因Ⅰ为x轴（y轴），基因Ⅱ为y轴（x轴）的二维平面上；如果每个细胞有三个基因（基因Ⅰ、基因Ⅱ、基因Ⅲ）表达，以此类推……

SARS-CoV-2感染的雪貂支气管肺泡灌洗液单细胞转录组数据挖掘（1）降维聚类分群

给学徒们收集整理了几套带GitHub源代码的文献图表合辑，让优秀者一点一滴拆解开来分享给大家。（全部的代码复制粘贴即可运行，欢迎尝试以及批评指正）

小技巧：R语言里删除带有缺失值的列

如果是要去除包含缺失值的行，直接使用na.omit()函数就可以了，但是如果要去除含有缺失值的列呢？

用R画带ErrorBar的分组条形图

用R画带ErrorBar的分组条形图本文介绍了如何用R画出带error bar的分组条形图。笔者近期画了一张带error bar的分组条形图，将相关的代码分享一下。感谢知乎网友青山屋主的建议，提示笔者要严谨区分技术重复和生物学重复，所以笔者对文章做修改后重发。如果各位有任何建议，欢迎指正。本文旨在给出一种利用R对生物学重复数据画带error bar的分组条形图的方法。所用数据是模拟生成的：分成三个组，每个组进行了若干次生物学重复；测量的是3种基因的表达量。数据的部分内容如下： ## g

TCGA生存分析②

接上文，Kaplan-Meier曲线有助于可视化两个分类组之间的生存差异，当你设置参数pval = TRUE时，可以获得的对数秩检验值有助于探讨不同组之间的生存率是否存在差异。但这并不能很好地评估连续性定量变量的对生存的影响。比如你的某一个node属性取值范围是0-33，这将导致生存曲线图上出现33条生存曲线。如果遇到分组过多或者想要评估多个变量如何协同以影响生存。例如，比如当希望同时检查种族和社会经济状况对生存的影响时就可能需要换种生存分析方法。

手动计算logFC（wilcoxon差异分析）

logFC是log fold change的缩写，也就是log之后的差异倍数。这个差异倍数意思是某个基因在A组表达量的平均值是B组表达量平均值的几倍。

「R」数据操作（五）：dplyr 介绍与数据过滤

在对数据进行可视化之前我们往往需要进行数据转换以得到可视化所需要的数据内容与格式。这里我们使用dplyr包操作2013年纽约市的航班起飞数据集（2013）。

R语言之箱型图修改中位数为平均数

但是有时，我需要将箱子中默认的中位数那条线，改为平均值。下面代码数据来源于上一篇博客：配对样本检验及绘图 - 简书 https://www.jianshu.com/p/e5a24590b5f6

单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析17

单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析1：https://cloud.tencent.com/developer/article/2055573

DESeq2差异表达分析(二)

DESeq2工作流程的下一步是QC，它包括样本级和基因级的步骤，对计数数据执行QC检查，以帮助我们确保样本/重复看起来很好。

单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析12

单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析1：https://cloud.tencent.com/developer/article/2055573

Python从零开始第三章数据处理与分析①python中的dplyr（1）

我经常使用R的dplyr软件包进行探索性数据分析和数据处理。 dplyr除了提供一组可用于解决最常见数据操作问题的一致函数外，dplyr还允许用户使用管道函数编写优雅的可链接的数据操作代码。

生信入门马拉松之R语言基础-脚本项目管理、条件循环、表达矩阵和一丢丢数据挖掘(Day 7)

数据框函数- 排序arrange()和desc参数、distinct()去重复、mutate()数据框新增列

fuzzyjoin实现模糊匹配连接

fuzzyjoin包是dplyr连接操作的变体，它可以支持模糊（匹配）连接，比如忽略单词之间的大小写，根据正则表达式进行连接，忽略单词的拼写错误等。

irGSEA：基于秩次的单细胞基因集富集分析整合框架

许多Functional Class Scoring (FCS)方法，如GSEA, GSVA,PLAGE, addModuleScore, SCSE, Vision, VAM, gficf, pagoda2和Sargent，都会受数据集组成的影响，数据集组成的轻微变化将改变细胞的基因集富集分数。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐