开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

在R中使用dplyr，我如何只保留那些包含变量的最长连续运行的行？

在R中使用dplyr，你可以使用group_by和mutate函数来实现只保留那些包含变量的最长连续运行的行。

首先，你需要加载dplyr包，并创建一个包含变量的数据框（data frame）。假设你的数据框名为df，变量名为var。

library(dplyr)

# 创建数据框
df <- data.frame(var = c(1, 2, 3, 4, 5, 1, 2, 3, 1, 2, 3, 4, 5))

# 使用group_by和mutate函数创建一个新的变量，表示每个连续运行的组
df <- df %>%
  mutate(group = cumsum(c(0, diff(var) != 1)))

# 使用group_by函数按照组进行分组，并计算每个组的行数
df <- df %>%
  group_by(group) %>%
  mutate(count = n())

# 找到最长连续运行的组
longest_group <- df %>%
  filter(count == max(count))

# 保留最长连续运行的行
result <- df %>%
  filter(group %in% longest_group$group)

# 移除辅助变量
result <- result %>%
  select(-group, -count)

这样，result数据框中将只包含那些包含变量的最长连续运行的行。

在这个例子中，我们使用了cumsum函数来创建一个新的变量group，表示每个连续运行的组。然后，使用group_by函数按照组进行分组，并使用mutate函数计算每个组的行数。接下来，我们找到最长连续运行的组，并使用filter函数保留最长连续运行的行。最后，我们使用select函数移除辅助变量。

请注意，这只是一个示例，你可以根据实际情况进行调整和修改。另外，腾讯云相关产品和产品介绍链接地址请参考腾讯云官方网站。

相关搜索:在R中，我如何使用dplyr进行此计算(1 -sigma(特定值的平方)？在R中，我如何使用gtsummary (或任何其他r包)创建一个包含五个二进制因素的列联表如何使用ggplot在R中创建包含2个数值变量的堆叠条形图，按1个因子变量分组-2次，并具有标准误差？如何使用R中的dplyr在两个表上打印按两个变量分组的grouped_df 如何使用循环在R中运行具有不同变量的回归？如何只在包含一个单元格的行上使用REGEXEXTRACT，这些单元格包含一个在SUM中包含字符串的行？如何在我的项目中使用SCA mvn插件在Fortify SCA扫描中只包含一个文件夹？当将行放入多个变量时，我如何找到文件的结尾(例如，在f中不使用for line )游戏服务器引擎秒杀游戏服务器部署秒杀

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Day6——R包

01

左手用R右手Python系列5——数据切片与索引

今天这篇跟大家分享我的R VS Pyhton学习笔记系列5——数据索引与切片。我之前分享过的所有学习笔记都不是从完全零基础开始的，因为没有包含任何的数据结构与变量类型等知识点。因为一直觉得一门编程语言的对象解释，特别是数据结构与变量类型，作为语言的核心底层概念，看似简单，实则贯穿着整门语言的核心思想精髓，所以一直不敢随便乱讲，害怕误人子弟。还是建议每一个初学者（无论是R语言还是Python,都应该用一门权威的入门书好好学习其中最为基础的数据结构、变量类型以及基础语法函数）。今天我要分享的内容涉及到R语

05

生信学习-Day6-学习R包

豆花寄语：学生信，R语言必学的原因是丰富的图表和Biocductor上面的各种生信分析R包。

01

2023.4生信马拉松day7-R语言综合应用

-（3）注意：之前提到过，矩阵的某一列不能单独转换数据类型，需要把矩阵转换成数据框再转换某列的数据类型；或者把这列单独提取出来再转换其数据类型；

08

生信入门马拉松之R语言基础-脚本项目管理、条件循环、表达矩阵和一丢丢数据挖掘(Day 7)

数据框函数- 排序arrange()和desc参数、distinct()去重复、mutate()数据框新增列

00

R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)

大型数据集通常是高度结构化的，结构使得我们可以按不同的方式分组，有时候我们需要关注单个组的数据片断，有时需要聚合不同组内的信息，并相互比较。

03

dplyr-cli：在Linux Terminal上直接执行dplyr

熟悉R的朋友都会知道， dplyr包是对原始的数据集进行清洗、整理以及变换的有力武器之一。但是其使用会局限于你需要有打开R/R studio或者通过R脚本来执行 dplyr。对于这个问题，今天即将需要介绍的 dplyr-cli就能很好的解决这个问题。

01

R语言第二章数据处理③删除重复数据目录总结

================================================

02

R︱高效数据操作——data.table包（实战心得、dplyr对比、key灵活用法、数据合并）

由于业务中接触的数据量很大，于是不得不转战开始寻求数据操作的效率。于是，data.table这个包就可以很好的满足对大数据量的数据操作的需求。

04

生信星球Day4 学习R包

方法一：手动设置，Tools→Packages→Primary CRAN repository

04

R语言安装R包DAY6-Gaozsi

一个新数据框，其中包含键、 x 值和 y 值。我们使用 by 参数告诉 dplyr 哪个变量是键：

01

数据流编程教程：R语言与DataFrame

DataFrame DataFrame 是一个表格或者类似二维数组的结构，它的各行表示一个实例，各列表示一个变量。一. DataFrame数据流编程二. 数据读取 readr/httr/DBI 1

R语言入门（一）之数据处理

写在前面：公众号又被我搁置好久，闲来无事，写写近期学的R语言吧，主要分为两个部分写，一主要为数据处理，二为ggplot作图。这两个部分将生信分析的绝大多数常用命令都讲到了，作为R语言入门是够用的，但是学海无涯，以此只是作为一个引子，想要进步还是要自己多学多练，举一反三才行。

04

35. R 数据整理（七：使用tidyr和dplyr处理数据框 2.0）

假设数据以 tibble 格式保存。数据集如果用于统计与绘图，需要满足一定的格式要求，(Wickham, 2014) 称之为整洁数据 (tidy data)，基本要求是每行一个观测，每列一个变量，每个单元格恰好有一个数据值。这些变量应该是真正的属性，而不是同一属性在不同年、月等时间的值分别放到单独的列。

03

快速掌握R语言中类SQL数据库操作技巧

在数据分析中，往往会遇到各种复杂的数据处理操作：分组、排序、过滤、转置、填充、移动、合并、分裂、去重、找重、填充等操作。这时候R语言就是一个很好的选择：R可以高效地、优雅地解决数据处理操作。（本章节为R语言入门第二部分总结篇：数据操作）

02

「R」数据操作（五）：dplyr 介绍与数据过滤

在对数据进行可视化之前我们往往需要进行数据转换以得到可视化所需要的数据内容与格式。这里我们使用dplyr包操作2013年纽约市的航班起飞数据集（2013）。

01

R数据科学-1（dplyr）

如今数据分析如火如荼，R与Python大行其道。你还在用Excel整理数据么，你还在用spss整理数据么。

02

R入门？从Tidyverse学起！

很多人推荐《R语言实战》这本书来入门R，当然，这本书非常不错，我也是通过这本书开始接触的R。这种入门的学习路径属于base R first，学习的流程基本是先了解变量的类型、数据的结构，再深入点就会学到循环与自定义函数。有些类似于先认识编程，再按照数据处理、可视化、统计分析等应用方向开始下一个学习的旅程。

03

【教你R语言】转换长宽格式表的落地方案

做数据分析以及制作表格的时候，会遇到长宽格式数据之间相互转换的问题，之前介绍了如果在Hive是使用sql语句实现，现介绍一下如何在R语言中实现长宽格式数据相互转换。

03

UseGalaxy.cn生信云|零代码使用Tiverse优雅地处理数据集

2023-11-10，Galaxy生信云平台 UseGalaxy.cn 新增 12 个工具。

02

R&Python Data Science 系列：数据处理（3）

排序函数，按照某（几）个指定的列按照升（降）序排列重新排列数据集，参数ascending = False，降序排列，ascending = True，升序排列；

02

GEO数据挖掘-基于芯片

在require()函数中，如果直接传递包的名称作为参数，不需要加引号；如果包的名称以字符串形式存储在变量中，则需要使用character.only = TRUE来指定这个变量是一个字符串

01

R for data science （第一章）①Chapter1 使用ggplot2进行数据可视化

本章将教您如何使用ggplot2可视化您的数据。 R有几个用于制作图形的系统，但ggplot2是最优雅和最通用的系统之一。 ggplot2实现了图形语法，它是一个用于描述和构建图形的系统。如果您想在开始之前了解更多关于ggplot2理论基础的内容，我建议您阅读“The Layered Grammar of Graphics”，

02

手把手教你用 R 语言分析歌词

翻译 | 刘朋 Noddleslee 程思婕余杭整理 | 凡江

03

阿榜的生信笔记7—R语言的综合运用1

哈喽，我是学习生物信息学的阿榜！非常感谢您能够点击进来查看我的笔记。我致力于通过笔记，将生物信息学知识分享给更多的人。如果有任何纰漏或谬误，欢迎指正。让我们一起加油，一起学习进步鸭? 这份学习目录可以

00

干货 | 男朋友老是说自己R语言很6，快来用这40道题目检测他

大数据文摘作品，转载要求见文末作者 | NSS 编译 | 张伯楠，刘云南弋心，卫青，宁云州 R语言是数据科学领域最流行的语言之一。如果你真想从事数据科学事业，那你要么已经会用R语言要么正在学习它。R语言同样是一个拥有广泛的统计和数据科学库的生态系统。为了帮助数据科学家测试他们的R语言能力，我们为DataFest 2017设计了一部分技能测试题。超过1500人注册了这项考试并有接近500人完成了测试。下图是不同测试者的成绩分布：下面是关于成绩分布的一些统计数据：平均分：16.69 分数中值：19

04

Day3-学习R包

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))：

01

两个神奇的R包介绍，外加实用小抄

认识Tidy Data1.Reshape Data2.Handle Missing Values3.Expand Tables4.split cells一、测试数据1.新建数据框2.用tidyr进行处理3.按照geneid排序4.空值操作用表二、Dplyr能实现的小动作1.arrange 排序2.fliter3.distinct4.select5.mutate6.summarise7.bind_rows8.交集、并集、全集9.关联

04

《高效R语言编程》6--高效数据木匠

将你的数据整理好是一个可敬的、某些情况下是至关重要的技能，所以作者使用了数据木匠这个词。这是本书最重要的一章，将涉及以下内容：

02

R启动

R被设计用于共享计算资源，如 Linux 服务器。因此，R的启动为个性化定制提供了很多途径：既适用于系统的每个用户，也适用于每个单独的用户。然而，这种灵活性伴随着代价的：复杂性。

04

R数据科学|第九章内容介绍

在实际应用中，我们常会涉及到多个数据表，必须综合使用它们才能找到关键信息。存在于多个表中的这种数据统称为关系数据。本章中的很多概念都和SQL中的相似，只是在dplyr中的表达形式略微不同。一般来说，dplyr 要比 SQL 更容易使用。

03

「R」dplyr 行式计算

通常 dplyr 和 R 更适合对列进行操作，而对行操作则显得更麻烦。这篇文章，我们将学习围绕rowwise() 创建的 row-wise 数据框的 dplyr 操作方法。

02

R语言之数值型描述分析

在分析之前，先将数据集 birthwt 中的分类变量 low、race、smoke、ht 和 ui 转换成因子。

02

如何使用管道操作符优雅的书写R语言代码

本文将跟大家分享如果在R语言中使用管道操作符优化代码，以及管道函数调用及传参的注意事项。使用R语言处理数据或者分析，很多时候免不了要写连续输入输出的代码，按照传统书写方式或者习惯，初学者往往会引入一大堆中介变量，或者使用函数嵌套进行一次性输出。以上两种方法虽然从结果上来看，同样可以达到我们预期的效果，但是无论是代码效率还是内存占用上都存在巨大劣势。 1、使用中介变量会使得内存开销成倍增长，特别是你的原始数据量非常大而内存又有限，在一个处理过程中引入太多中介对象，不仅代码冗余，内存也会迅速透支。 2、使用

07

数据处理|R-dplyr

arrange函数按给定的列名进行排序，默认为升序排列，也可以对列名加desc()进行降序排序。

01

命令行上的数据科学第二版：六、项目管理与`make`

我希望现在您已经开始认识到命令行是一个非常方便的数据处理环境。您可能已经注意到，由于使用了命令行，我们：

01

使用R和Shiny创建数据可视化仪表盘的详细教程

数据可视化仪表盘是将数据直观呈现并提供交互性的强大工具。R语言与Shiny框架的结合，使得创建交互式数据可视化仪表盘变得轻松而灵活。在这篇博客中，我们将深入介绍如何使用R和Shiny创建一个简单而实用的数据可视化仪表盘。

01

字节跳动2019算法笔试题第二弹，很考基础的基础题

大家好，我们继续来看字节跳动的招聘真题。题目同样源于牛客网，感兴趣的同学记得去亲自做一做练习哦。

03

学习小组Day6——学习R包

学习小组Day6——学习R包图片学习R包安装加载R包1.镜像的设置解决R包在国外，下载慢的问题1.初级模式：在Rstuidio程序中设置 Tools-Packages-Primary CRAN repositorry图片2.高级模式——修改Rstudio配置文件图片生信星球2.安装包可以从CRAN、Biocductor及Github下载安装，指令不同CRAN:install.packages("包")Biocductor：BiocManager::install("包")Github：devtools::i

02

R绘图 | 表达矩阵画箱线图

变量可以分为很多种，如连续变量、分类变量等。当数据集中包含了分类变量和连续变量时，我们想了解连续变量是怎样随着不同的分类变量水平变化而变化，这时散点图中则会出现大量重叠，而箱式图则可以更清晰的展示这类数据。

02

R tips：使用!!来增加dplyr的可操作性

dplyr包在数据变换方面非常的好用，它有很多易用性的体现：比如书写数据内的变量名时不需要引号包裹，也不需要绝对引用，而这在多数baseR函数中都不是这样的，比如：

03

生信学习小组Day6笔记—Chocolate Ice

首先用file.edit('~/.Rprofile')打开.Rprofile文件；然后在.Rprofile文件内添加下列两行代码

03

Linux命令执行顺序控制与管道、cut 、grep 、wc 、sort

本篇内容：顺序执行、选择执行、管道、cut 命令、grep 命令、wc 命令、sort 命令等，高效率使用 Linux 的技巧。

03

R语言学习笔记-Day6

00

R语言学习笔记

请注意，本文编写于 398 天前，最后修改于 378 天前，其中某些信息可能已经过时。

R语言之 dplyr 包

这个包以一种统一的规范更高效地处理数据框。dplyr 包里处理数据框的所有函数的第一个参数都是数据框名。

02

数据处理第3部分：选择行的基本和高级的方法

原文地址：https://suzan.rbind.io/2018/02/dplyr-tutorial-3/ 作者：Suzan Baert 这是系列dplyr系列教程中的第三篇博客文章。在这篇文章中，我们将介绍如何挑选您的数据。除了filter的基础知识外，它还介绍了一些更好的方法，用near（）和between（）挑选数字列，或用正则表达式过滤字符串列。

01

R||R语言基础（三）_R包

部分人可能会因为镜像的问题失败，解决方法https://mp.weixin.qq.com/s/XvKb5FjAGM6gYsxTw3tcWw

05

数据处理|数据查重怎么办？去重，就这么办！

数据清洗过程中的典型问题：数据分析|R-缺失值处理、数据分析|R-异常值处理和重复值处理，本次简单介绍一些R处理重复值的用法：

03

什么是sparklyr

我们（RStudio Team）今天很高兴的宣布一个新的项目sparklyr（https://spark.rstudio.com），它是一个包，用来实现通过R连接Apache Spark。

09

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭