如何在给定特定行顺序的情况下在R data.table中对行进行重新排序

在R data.table中，可以使用setorder()函数对行进行重新排序。setorder()函数可以按照指定的列顺序对data.table进行排序，同时也可以指定升序或降序。

以下是在给定特定行顺序的情况下在R data.table中对行进行重新排序的步骤：

首先，确保已经安装并加载了data.table包。如果没有安装，可以使用以下命令进行安装：

install.packages("data.table")

加载data.table包：

library(data.table)

创建一个data.table对象，例如：

dt <- data.table(ID = c(1, 2, 3, 4, 5),
                 Name = c("John", "Alice", "Bob", "Emma", "David"),
                 Age = c(25, 30, 35, 40, 45))

定义特定行的顺序。例如，如果要按照ID列的升序对行进行排序，可以使用以下代码：

order_rows <- c(2, 5, 1, 4, 3)

使用setorder()函数对data.table进行重新排序。在setorder()函数中，将data.table对象作为第一个参数，指定要排序的列和顺序作为后续参数。例如，按照ID列的顺序对data.table进行排序：

setorder(dt, ID)

最后，使用setorder()函数对特定行进行重新排序。在setorder()函数中，将data.table对象作为第一个参数，指定要排序的列和顺序作为后续参数。例如，按照order_rows中定义的顺序对data.table进行排序：

setorder(dt, ID, order_rows)

完成以上步骤后，data.table将按照指定的行顺序进行重新排序。

请注意，以上答案中没有提及任何特定的腾讯云产品或链接地址，因为在这个特定问题中没有与腾讯云相关的内容。

相关·内容

R︱高效数据操作——data.table包（实战心得、dplyr对比、key灵活用法、数据合并）

9.3K4 3

R语言数据分析利器data.table包 —— 数据框结构处理精讲

将一个R对象转化为data.table，R可以时矢量，列表，data.frame等，keep.rownames决定是否保留行名或者列表名，默认FALSE,如果TRUE,将行名存在"rn"行中，keep.rownames...的列名，old是旧列名或者数字位置，new是新列名 setcolorder(x,neworder) 重新安排列的顺序，neworder字符矢量或者行数 set(DT,rownum,colnum,value...比如此例取出DT 中 X 列为"a"的行，和"a"进行merge。on参数的第一列必须是DT的第一列 DT[....(sum(y)), by=x] # 对x列进行分组后对各分组y列求总和 DT[, sum(y), keyby=x] #对x列进行分组后对各分组y列求和，并且结果按照x排序 DT[, sum(y)..., by=x][order(x)] #和上面一样，采取data.table的链接符合表达式 DT[v>1, sum(y), by=v] #对v列进行分组后,取各组中v>1的行出来，各组分别对定义的行中的

5.9K2 0

R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)

介绍一种按照日期范围——例如按照周、月、季度或者年——对其进行分组的超简便处理方式：R语言的cut()函数。...：对每个小片断独立进行操作； combine：把片断重新组合。...在base包里和split功能接近的函数有cut(对属性数据分划)，strsplit(对字符串分划)以及subset（对向量，矩阵或数据框按给定条件取子集）等。...可以看到，计算结果中的第一列实际上是“SELLERID.CLIENT”，我们需要把它拆分成两列并调换顺序才行。...data.table包的语法简洁，并且只需一行代码就可以完成很多事情。进一步地，data.table在某些情况下执行效率更高。

20.9K3 2

Matt Dowle 演讲节选（二）

例如代码DF[2:3, sum(B), by = group]，其中i的部分为2:3，表示对行的选择；j的部分为sum(B)，表示对列进行运算；by的部分对应by = group，表示按照变量group...这里的关键在于，在第一种方法中，每为新的一行赋值，data.table就要重新复制一遍DT，也就是说，第一种方法的运行过程中，DF被复制了1000遍！...而在第二种方法中，由于采用了 assignment by reference，data.table仅对内存中v1所在的地址进行修改，其他地方则不变！事实上，DF 在第二种方法中一遍都没有被复制！...因为任何对列的处理都必须导致数据集在内存中的复制，也即假如我们的内存是 4G，那么在使用data.frame的情况下，我们最大就只能处理 2G 的数据集！...在这个2012年（注意dplyr的最早版本在2016年！）的帖子中，一个用户需要处理以下数据集（这里只显示前6行） ? 他想首先按照gene_id分组，然后分别计算特定变量的极值和均值。

1.1K4 0

关于data.table中i, j, by都为数字的理解

在往期的公众号文章，都提到了data.table的主要语句DT[i, j, by], 简而言之，i 用来选择或者排序，by 用来分组，j 用来运用函数进行处理。...看到这个结果大家是不是还有点一头雾水，下面就让笔者来对这个结果进行分析讲解。...问题解析为了弄清楚这个问题，我们根据i, j, by运行的顺序：“先i，再by，最后j”，将i, j, by拆解进行分析。...首先，我们单独看i只有一个1的情况下是什么运行结果，为了让运行出来的代码被认定是data.table的格式，我们在j中加入.SD（不清楚.SD用途的小伙伴可以查看data.table的manual，或者查看笔者上一篇推送用...可见，在DT的i中输入一个数字和用一般的提取符号`[`只输入一个数字的结果完全一样，就是提取这个数据集中的某一行。

1.3K3 0

ggplot2热图扩展包（ggalign）的细节

align_dendro：根据层次聚类或树状图对图表进行对齐。 align_group align_group() 函数将行/列进行分组。它不会添加任何绘图区域。...在这里，我们根据均值重新排序行。...，align_order() 会根据函数的输出结果（对于行，从底部到顶部；对于列，从左到右）按升序重新排序行或列。...需要注意的是，所有 align_* 函数都将行视为观测。这意味着 NROW(data) 必须与特定的 layout 轴返回相同的观测数。...align_group(column_groups) + align_dendro(aes(color = branch)) 您可以通过设置 reorder_group = TRUE 对组进行重新排序

1291 0

R语言学习笔记之——数据处理神器data.table

合理选择一套自己的数据处理工具组合算是挺艰难的选择，因为这个涉及到使用习惯和迁移成本的问题，比如你先熟知了R语言的基础绘图系统，在没有强大的驱动力的情况下，你可能不太愿意画大把时间去研究ggplot2，...data.table 1、I/O性能： data.table的被推崇的重要原因就是他的IO吞吐性能在R语言诸多包中首屈一指，这里以一个1.6G多的2015年纽约自行车出行数据集为例来检验其性能到底如何，...DT[i,j,by] 如果这个过程是SQL中是由select …… from …… where …… groupby …… having 来完成的，在R的其他基础包中起码也是分批次完成的。...如果想要运行的同时进行输出则可以在结尾加上[] setorder(mydata,carrier,-arr_delay)[] ? 这个功能有点儿类似于基础函数中，在语句外部加上圆括号。...以上语法加入了新的参数.SDcols和.SD,咋一看摸不着头脑，其实是在按照carrier,origin,dest三个维度分组的基础上，对每个子块特定列进行均值运算。

3.6K8 0

R练习50题 - 第一期

unique：找出symbol中不重复的值。在data.table的语法中，先进行列选择操作，再对列进行处理。所以上述语句会先执行str_detect，再执行unique。...这是因为data.table的第一个语句用来对列进行选择，由于我们这里需要对所有列进行统计，所以不需要进行任何操作。 keyby用来进行分组，是整个代码的核心。先来看keyby = ....(date, updown)这个结构，他的意思是，把整个数据集按照date和updown两个变量进行分组，并依次排序。...代码第二行生成了一个新变量num。由于在keyby语句中我们已经按照日期与涨跌进行了分组，所以这一步我们只需要统计每个组有多少个股票就可以了。我们在这里使用了uniqueN这个函数。...整个代码的执行顺序是：先选择行（逗号空白行），再分组（keyby语句），最后进行组间统计（num语句）。我们的答案中，行、列以及分组三条语句各占一行，实际上这仅仅是为了让代码更直观。

2.5K4 0

「Workshop」第五期：使用data.table操作数据

的部分函数在使用的过程中会直接对原来的数据进行改写，为了防止原来的数据被改变，使用拷贝的文件。...的常用函数 setcolorder(x,neworder) 重新安排列的顺序 > setcolorder(dt, c("d","e","c","name", "money", "number"))...按相同的列内容进行data.table组合 ?...输出R环境中名为dt的数据框为.csv文件 foverlaps() foverlaps() 格式 foverlaps(x, y, by.x = if (!...其他 nomatch = NULL 返回匹配得上的部分 setkey() 设置匹配索引参数which = TRUE 是只返回两个数据框匹配情况的行号参数mult = "first" 是返回x中第一次匹配上的行

3.3K5 0

「R」数据操作（三）：高效的data.table

N是最常用的符号之一，它表示当前分组中，对象的数目（就不用调用nrow函数啦）。在[]使用它指提取最后一行。...1个参数是行筛选器，第2个则对筛选后的数据进行适当的计算。...data.table中，by所对应的组合中的值是唯一的，虽然实现了目标，但结果中没有设置键： key(type_class_test0) #> NULL 这种情况下，我们可以使用keyby来确保结果的data.table...一般data.table会保持原来的顺序返回，有时候我们想要设定排序，keyby也可以实现，所以是一举两得： type_class_test = product_info[product_tests][...("model", "vehicle"), mean_quality] #> [1] 6 对大数据集使用键进行搜索，能够比迭代使用逻辑比较快得多，因为键搜索利用了二进制搜索，而迭代在不必要的计算上浪费了时间

6.4K2 0

理解PG如何执行一个查询-1

每个算子都有不同的成本估算。例如，对整个表进行顺序扫描的成本计算为表中8K块的数量，加上一些CPU开销。选择代价最低的执行计划后，查询执行器从计划的开头开始，并向最顶层的算子要结果集。...这种情况下，第一步实际上列在计划的末尾。当阅读查询计划时，务必记住计划中每个步骤都会产生一个中间结果集。每个中间结果集都会送入计划的下一步。...在这两种情况下，您都在对整个表执行顺序扫描。在顺序扫描完成构建其中间结果集后，它被送入计划的下一步。这个特定计划的最后一步是排序操作，它是满足我们的ORDER BY子句所必需的。...排序操作对顺序扫描产生的结果集进行重新排序，并将最终结果集返回给客户端应用程序。注：ORDER BY子句在所有情况下都不需要排序操作。规划器/优化器可能决定它可以使用索引来对结果集进行排序。...其次，Seq Scan按表顺序返回行，而不是按排序顺序。索引扫描将按索引顺序返回行。并非所有索引都是可扫描的。可以扫描B-Tree、R-Tree和GiST索引类型；哈希索引不能。

2K2 0

R语言基因组数据分析可能会用到的data.table函数整理

因此，在对大数据处理上，使用data.table无疑具有极高的效率。这里主要介绍在基因组数据分析中可能会用到的函数。...，R层次的C代码 data.table TRUE返回data.table，FALSE返回data.frame 可见1.8GB的数据读入94秒，读入文件速度非常快 fwrite 对数据框数据进行处理后...前面三个选项都是用新的特定C代码写的，较快; buffMB 每个核心给的缓冲大小，在1到1024之间，默认80MB; nThread 用的核心数; showProgress 在工作台显示进程...显示没有联合成功的行列 value.var 填充值的列，默认会猜测现在我需要取数据DT的v1,v2两列相同的情况作为汇总的一类，对它们的v4值取平均，转换如下，...by ]语法做但是如果我要将上述DT中的v3作为一个影响因素，作为tag，先按v1、v2汇总，再将对应的v4值分为v3=1和v3=2两类，查看v1、v2取值相同v3不同对应v4的情况，这个时候用dcast

3.4K1 0

懒癌必备-dplyr和data.table让你的数据分析事半功倍

接下来，我就为大家分享几个我在工作当中最常用来做数据分析用到的包，dplyr和data.table，我保证你get到这两个包后，就再也不想用R里面自带的基础包函数进行数据分析了！！...(V2),V3) 对V1，V3升序排序，对V2降序排序 ※arrange的语法非常简单，功能也很强大，我们再也不要用order()函数了 select( ) 选择列 select(df,V1,V2,V3...①第一个参数都是数据集df ②查询条件都是关于如何操作数据集的，在列上面进行操作 ③返回的都是新的数据集，不会改变原始数据集在介绍下一个包之前，我们先来引入一个dplyr包的综合运用： grouped...data.table包 dplyr已经可以满足我们数据分析工作中大部分的需求，后来该包的作者又开发了一个炫酷吊炸天的包“data.table” 如果你的日常处理数据在几万到十几万行，那么用dplyr...以上讲的这些只是我工作中data.table用得最多的功能，它的强大之处还远远不止这些！如果你想深入，可以去官网下载文档，你绝对值得拥有！

2.5K7 0

数据流编程教程：R语言与DataFrame

(x, y): 所有 x 在 y 中匹配的部分 anti_join(x, y): 所有 x 在 y 中不匹配的部分（3）集合操作 intersect(x, y): x 和 y 的交集（按行） union...(x, y): x 和 y 的并集（按行） setdiff(x, y): x 和 y 的补集（在x中不在y中）更多详细操作可以参考由SupStats翻译的数据再加工速查表，比Python的老鼠书直观很多...数据建模 broom 1. broom 在机器学习的本质其实就是各种姿势的回归，而在R中的各种回归分析往往不会返回一个整齐的data frame 结果。...data.table完美兼容data.frame，这意味着之前对data.frame的操作我们可以完全保留，并且支持更多方便的数据操作方法。...3.R Tutorial: Data Frame 4.Python Pandas 官方文档 5.知乎：R语言读大数据？ 6.知乎的高分问答：如何使用 ggplot2？

3.9K12 0

Python的Datatable包怎么用？

前言 data.table 是 R 中一个非常通用和高性能的包，使用简单、方便而且速度快，在 R 语言社区非常受欢迎，每个月的下载量超过 40 万，有近 650 个 CRAN 和 Bioconductor...如果你是 R 的使用者，可能已经使用过 data.table 包。...在某种程度上，datatable 可以被称为是 Python 中的 data.table。...诸如矩阵索引，C/C++，R，Pandas，Numpy 中都使用相同的 DT[i，j] 的数学表示法。下面来看看如何使用 datatable 来进行一些常见的数据处理工作。 ?...▌帧排序 datatable 排序在 datatable 中通过特定的列来对帧进行排序操作，如下所示： %%time datatable_df.sort('funded_amnt_inv') ___

7.2K1 0

Python的Datatable包怎么用？

6.7K3 0

一文入门Python的Datatable操作

7.7K5 0

如何用R进行中文分词？

本期，大猫先教大家如何使用jiebaR进行分词！...不光在R中，在Python等语言中，结巴分词也是最优秀、使用最广的分词包之一。jiebaR是jieba分词的R版本，使用了Rcpp进行编写，充分利用了C++高效的特点。...目前，结巴分词在C++、R、Python平台下都有对应版本，无论你采用那个平台，都能获得接近一致的体验。 2）安装data.table。...data.table是当前R中最强大的数据处理包之一，在大猫课堂中，所有的数据处理都要使用到data.table。...第二行代码中，dt[, text.seg := x.out]的作用是：在数据集dt中新生成一个变量text.seg，其值等于向量x.out。

1.3K1 0

Hbase入门(三)——数据模型

HBase表中的行是通过行键（Rowkey）进行区分的。行键也是用来唯一确定一行的标识。 HBase中的行按Rowkey排序，排序方式采用字典顺序。...因此，在时间戳t8处对contents:html列的值的请求将不返回任何值。类似地，在时间戳t9处对anchor:my.look.ca值的请求将不返回任何值。...但是，如果未提供时间戳，则将返回特定列的最新值。给定多个版本，最新版本也是第一个版本，因为时间戳按降序存储。...Get 操作返回指定行的属性，Get是在Scan基础上实现的。在默认情况下，如果没有指定版本，一旦使用Get操作，会返回最近版本的Cell。...有三种不同类型的内部删除标记。删除：对于特定版本的列。删除列：适用于列的所有版本。删除系列：适用于特定 ColumnFamily 的所有列 SCAN 扫描表下面是对表进行扫描的示例。

1.1K2 0

Princeton Algorithms, Burrows-Wheeler

事实上，第 3 步的 Huffman 压缩才是唯一对信息进行压缩的步骤，但是前 2 步的变换和编码可以保证特定字符出现的频率高于其他字符，从而保证 Huffman 压缩具有较高的压缩效率。...它依赖于以下的直觉：如果你在英文文本中看到字母 hen，那么，大多数情况下，它前面的字母不是 t 就是 w。我们先来看一个例子，然后解释一下 Burrows–Wheeler 变换是如何进行的。...那么，next[first] 就是排序顺序中第 1 个原始后缀（原始字符串左移 1）出现的行、next[next[first]] 是排序顺序中第 2 个原始后缀出现的行、next[next[next[first...对于一个在输入字符串中只出现过一次的字符，很容易推导出 next[]。例如，考虑以 C 开头的后缀：通过检查第一列，它在排序顺序中出现了第 8 位。...在这之后的下一个原始后缀将以 C 作为最后一个字符（因为每次是对原始字符串循环左移 1 位，所以 C 必定被移动到了最后一位），通过检查最后一列，下一个原始后缀在排序顺序中出现第 5 个字符。

6551 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何在给定特定行顺序的情况下在R data.table中对行进行重新排序

相关·内容

R︱高效数据操作——data.table包（实战心得、dplyr对比、key灵活用法、数据合并）

R语言数据分析利器data.table包 —— 数据框结构处理精讲

R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)

Matt Dowle 演讲节选（二）

关于data.table中i, j, by都为数字的理解

ggplot2热图扩展包（ggalign）的细节

R语言学习笔记之——数据处理神器data.table

R练习50题 - 第一期

「Workshop」第五期：使用data.table操作数据

「R」数据操作（三）：高效的data.table

理解PG如何执行一个查询-1

R语言基因组数据分析可能会用到的data.table函数整理

懒癌必备-dplyr和data.table让你的数据分析事半功倍

数据流编程教程：R语言与DataFrame

Python的Datatable包怎么用？

Python的Datatable包怎么用？

一文入门Python的Datatable操作

如何用R进行中文分词？

Hbase入门(三)——数据模型

Princeton Algorithms, Burrows-Wheeler

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐