文章/答案/技术大牛

发布

当按两个变量分组时，data.table中的下标超出边界

是指在使用data.table进行数据操作时，当按照两个或多个变量进行分组时，可能会出现下标超出边界的情况。

在data.table中，可以使用by参数来指定按照哪些变量进行分组。例如，假设我们有一个data.table对象dt，其中包含了两个变量var1和var2，我们想要按照这两个变量进行分组，并对分组后的数据进行操作。

library(data.table)

# 创建一个示例data.table对象
dt <- data.table(var1 = c("A", "A", "B", "B", "C"),
                 var2 = c(1, 2, 1, 2, 1),
                 value = c(10, 20, 30, 40, 50))

# 按照var1和var2进行分组，并计算每组的平均值
dt[, mean(value), by = .(var1, var2)]

然而，当我们使用by参数指定多个变量进行分组时，有时可能会出现下标超出边界的错误。这通常是由于数据中存在缺失值或者分组变量的取值范围不正确导致的。

为了解决这个问题，我们可以先检查数据中是否存在缺失值，并对分组变量的取值范围进行确认。可以使用complete.cases()函数来检查数据中是否存在缺失值，使用unique()函数来查看分组变量的取值范围。

# 检查数据中是否存在缺失值
anyNA(dt$var1)
anyNA(dt$var2)

# 查看分组变量的取值范围
unique(dt$var1)
unique(dt$var2)

如果发现数据中存在缺失值，可以使用na.omit()函数将包含缺失值的行删除。如果发现分组变量的取值范围不正确，可以使用factor()函数将其转换为因子类型，并指定正确的水平顺序。

另外，当使用data.table进行分组操作时，还可以结合使用其他函数来进行数据处理，例如sum()、count()、max()等。此外，data.table还提供了丰富的函数和操作符，用于数据的筛选、排序、合并等操作。

腾讯云提供了一系列与云计算相关的产品，例如云服务器、云数据库、云存储等。具体可以参考腾讯云的官方文档：腾讯云产品与服务。

当按两个变量分组时，data.table中的下标超出边界

、

我有这样的数据表： Name_of varia years value 2:- long$years return (p_value_coef)当我按一列对它进行分组时，它没有问题 dt_to_analyse[,data.frame(val=gmch_function(

浏览 7提问于2019-10-20得票数 1

1回答

下标[]运算符与push_back方法在C++字符串中插入字符的区别

、、

我被这个愚蠢的怀疑困住了，无法理解我理解错了哪一部分。我试图填充一个空字符串，我想使用subscipt []操作符来完成它，但是我发现虽然循环运行得很好，但是最后的字符串仍然是空的，大小为零。

浏览 2提问于2022-07-12得票数 0

回答已采纳

1回答

检查在data.table中使用by创建的块

、

是否有一种简单的方法来检查在data.table中使用“by”时创建的数据块之一？例如，如果我将虹膜按“物种”分组ir[, someFunction(), by = Species]我希望能够看到所有的变量，以确保分组是正确的，但是在使用'by‘中</e

浏览 2提问于2015-08-17得票数 1

回答已采纳

1回答

jQuery可拖动图像，当鼠标超出边界时停止拖动(Div)

、、、

我有一个在div中运行的可拖动的图像。然而，我想这样做，如果当用户按下鼠标并拖动元素/ div时，当鼠标按下或其边界离开div时，它将不再可拖动。当按下控件上的按钮时，将启用拖动，该按钮将正常工作。我只是希望能够在鼠标超出特定div /元素的边界时停止拖动。这是复合控件的

浏览 6提问于2012-03-21得票数 3

回答已采纳

1回答

如果用户的输入越界，我希望忽略他们的输入

、

我试图寻找我的问题的答案，但找不到任何非常正确的东西。这是我不能修改的类。我只能继承它才能做到这一点。

浏览 0提问于2013-05-22得票数 0

回答已采纳

3回答

如何显式命名由.N函数生成的计数列？

、、

我想按一个id列对数据表进行分组，然后计算每个id发生的次数。这样做的办法如下：dt_by_id <- dt[, .N, by = id] id N .N是一个整数，长度1，包含组中的行数。这可能是有用的，当列名是不知道事先和方便一般。当按</em

浏览 0提问于2018-08-31得票数 3

回答已采纳

1回答

编辑模式下具有自定义UITableView的分组UILabels

、、、

我有一个分组的UITableView，用户可以在其中进入编辑模式并从表中删除行。表的每个单元格都有两个UILabels。当表格进入编辑模式时，自定义UILabels向右推并超出单元格的右边界。如果我使用标准的cell.textLabel，标签会调整大小并保持在单元格的边框内。关于如何使用自定义UILabels做到这一点有什么想法？

浏览 1提问于2011-05-24得票数 2

回答已采纳

1回答

是否有一种方法可以在Swift中迭代数组中的元素，方法是使用UIButton操作递增计数？

、

我正在使用存储在字典中的数据来查询文档。我希望能够遍历每个文档，按下一个IBAction UIButton，这个函数也会增加输入循环计数。

浏览 1提问于2021-10-26得票数 0

回答已采纳

2回答

C#‘指数超出了数组的范围’。对于一个数组而不是另一个数组

、、

我有两个数组，用于存储来自用户的2组输入。我将两个数组的边界设置为相等于相同的变量，但是当输入信息时，在第一个数组的最后输入之后，我会得到一个异常'Index超出了数组的界限‘。当我试图将数组的边界更改为常量时，它们的行为是正常的。ratings[i] = Convert.ToDou

浏览 1提问于2019-11-03得票数 1

回答已采纳

1回答

使用向量列表中名称的r子集数据帧列

、

是否可以使用存储在列名数组中的列(如c("col1“、"col9”、"col6")中的列名将数据帧列子集(为新的df)？我知道我可以使用df[colname]语法引用df中的一个列，但它不允许我对多个列进行引用： X1 X2 X32: b 5 34:c 6 5 cnm<-c("X2","X3&qu

浏览 0提问于2016-09-14得票数 5

3回答

dplyr中多个聚合条件的细分

、、、、

我希望有人知道在dplyr中有一个简单有效的变量，如果在日期X上，IP地址出现超过50次，我就可以定义一个指示变量来取1的值。数据是两列，一个是IP地址，另一个是相关的访问日期。例如，我希望在机器人列中获得以下输出(假设日期/IP组合为>=3)。

浏览 9提问于2016-01-18得票数 0

回答已采纳

1回答

使用'lapply‘和' by’通过引用修改data.table将为分组列创建重复的行

、、

所以我也建议修改我的标题，所以如果有人发布了一个答案的链接，我会很好的！我在下面有一个MWE。我尝试按每个月的日期按列val进行分组。据我所知，在下面代码中的场景1中，由于我没有通过:=将lapply的值赋给任何新列，因此将打印data.table。但是，在场景2中，当我使用:=通过引用分配新的列变量时，会创

浏览 1提问于2018-11-06得票数 0

4回答

访问C++空字符串中的任何位置

、

str[2] = 'a'我在这里感到困惑，可能遗漏了一些东西。

浏览 0提问于2015-07-01得票数 1

1回答

为什么我的表演循环不起作用？

我想弄清楚为什么我的执行没有被执行？问题:循环从未被输入，为什么？

浏览 5提问于2014-03-07得票数 1

回答已采纳

2回答

为什么使用:=和tstrsplit创建的新列在有或没有`by`参数的情况下会有所不同？

、

可能的原因是什么？library(data.table) DT2 <- copy(DT1) DT1[, c('col_a', 'col_b

浏览 4提问于2021-04-14得票数 1

回答已采纳

1回答

按data.table中的所有列分组时，.SD为空

、

我很难在data.table中使用一致的语法获得一致的输出。(x, y)]当所有列都用于by中的分组时，.SD为空，导致返回一个空的data.table。当添加另一列时，.SD包含未按其分组的列，则返回正确的

浏览 3提问于2015-04-06得票数 2

回答已采纳

1回答

memoization可以与动态编程中的迭代解一起使用吗？

、、

例如，当使用递归时，可以用记忆法求解斐波那契数列。但是迭代地求解Fibonacci (栈+ while循环)也可以利用记忆化吗？

浏览 1提问于2017-06-20得票数 4

1回答

R data.table:按表达式分组时保留列

、

当按涉及列(例如DT[...,.SD[c(1,.N)],by=expression(col)])的表达式分组时，我希望将col的值保留在.SD中。例如，在下面的示例中，我通过a的剩余部分除以3进行分组，并将第一个和最后一个观察值保留在每个组中。但是，.SD中不再存在a Q <- data.table(a

浏览 9提问于2020-03-04得票数 3

回答已采纳

1回答

增加/减少正方形的速度

、

这是我写的在屏幕上移动正方形的算法，Xcenter和Ycenter是正方形的中心。speedX表示水平方向的速度，speedY表示垂直方向的速度。speedX++，只是在水平方向上增加，因此没有给出预期的结果。提前谢谢。

浏览 3提问于2016-03-28得票数 1

1回答

setkey和:=运算符，data.table，R

、、、

在使用data.table包时，我有点不确定什么时候需要setkey()。例如，当使用带有by选项的:=运算符时，即使我没有设置关键点，事情似乎仍然非常快。如果在使用by调用:=之前不是必需的，那么data.table包怎么会这么快，因为它可能必须通过执行顺序搜索而不是二进制搜索来做与标准data.frame R中的apply相同的事情，因为它不知道我的data.table是否真的

浏览 0提问于2012-07-21得票数 18

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

当按两个变量分组时，data.table中的下标超出边界

相关·内容

当按两个变量分组时，data.table中的下标超出边界

下标[]运算符与push_back方法在C++字符串中插入字符的区别

检查在data.table中使用by创建的块

jQuery可拖动图像，当鼠标超出边界时停止拖动(Div)

如果用户的输入越界，我希望忽略他们的输入

如何显式命名由.N函数生成的计数列？

编辑模式下具有自定义UITableView的分组UILabels

是否有一种方法可以在Swift中迭代数组中的元素，方法是使用UIButton操作递增计数？

C#‘指数超出了数组的范围’。对于一个数组而不是另一个数组

使用向量列表中名称的r子集数据帧列

dplyr中多个聚合条件的细分

使用'lapply‘和' by’通过引用修改data.table将为分组列创建重复的行

访问C++空字符串中的任何位置

为什么我的表演循环不起作用？

为什么使用:=和tstrsplit创建的新列在有或没有`by`参数的情况下会有所不同？

按data.table中的所有列分组时，.SD为空

memoization可以与动态编程中的迭代解一起使用吗？

R data.table:按表达式分组时保留列

增加/减少正方形的速度

setkey和:=运算符，data.table，R

扫码

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐