存在lubridate interval对象列时的data.table子集行数

、

我收到一条错误消息，其中包含一个我不理解的data.table。我有一个主data.table，它是基于ID变量的子集。一旦我有了第二个data.table，我又想用一个行索引向量将其子集。不幸的是，我不能分享我的数据，也不能用另一个数据集重现错误。很抱歉，我不能提供比这更多的细节。有人能说出这些有限的信息是怎么回事吗？> class(auth) [1] "data.tabl

浏览 11提问于2021-05-19得票数 1

1回答

data.table工程中润滑油期的不当分配

、、

最近，我发现了data.table的赋值运算符:=的一种奇怪的行为，当我想将lubridate的period对象赋值给列时，它只将第一个句点分配给所有单元。library(data.table) ][x == 4,p #

浏览 2提问于2018-06-22得票数 2

1回答

在data.table* R中遍历列*

、、

我试图在R.中的data.table包中循环列，我在子集datatable时尝试获取for循环以准确地输入列时遇到了困难。data <- data.table(va=c(1,0,1), vb=c(1,0,0), vc=c(1,1,1)) names <-

浏览 4提问于2020-01-17得票数 1

回答已采纳

3回答

取使用为每一行生成的布尔向量选择的行子集的平均值。

、

我可以使用sapply执行以下操作，但是我希望dplyr也可以这样做，或者如果它是dplyr范围之外的问题。1)获取值日期3)使用此布尔向量对整个原始数据进行子集 4)取此数据的平均值。5)将值存储在一个名为mean_for_Date

浏览 0提问于2018-03-10得票数 2

回答已采纳

1回答

Data.table:创建新变量，按日期周期细分，按第二个变量x分组，并按每个x的最终日期聚合结果。

、

我对data.table完全陌生，所以请容忍我。在下面的示例中，我想在dataset中创建两个新列:每个客户ID在两个不同时间段内的总购买价格。然而，当我试图对数据进行子集时，我会陷入困境。我想要子集的数据，以便每一行代表一个独特的客户ID，连同他们的最终购买价格，最后购买日期，期间1购买价格总额，和他们的第二个采购价格总额。我认为data.table可以在对应于每个客户的所有行

浏览 1提问于2016-10-12得票数 0

回答已采纳

1回答

data.table中的Interval类

、、

我的问题将在下面的可重现的例子中得到解释。首先，让我们加载所需的包并创建一个POSIXct和一个data.table对象。对象的新列。:第一个是POSIXct列的函数，第二个是Interval列的函数。然后，当我对Interval列的列函数执行相同的操作时

浏览 17提问于2018-02-02得票数 4

2回答

我目前有一个包含Start.Time列的数据框架(从*.csv文件导入)，格式为24小时格式(例如，20:00:00等于8 8pm)。我的目标是以不同的间隔(例如9:00:00到10:00:00)捕获具有起始时间的观察，这也符合其他标准。但是，似乎R对这个“字符”变量的排序方式与我们的一天的运行方式不一致(例如，14:00:00被认为是一个比9:00:00低的值)。例如，下面是一行按预期工作的代码，

浏览 0提问于2021-09-16得票数 0

回答已采纳

2回答

将S4对象存储在data.frame或data.table中

、、、、

我正在尝试将复杂的 S4 对象(使用Seurat包生成)放入 data.table (我读到不可能使用list或data.frame，但我没有发现任何关于data.table与S4对象的兼容性的信息)这些对象都来自我编写的函数中称为dataset的一个更大的对象： nclust=d

浏览 2提问于2020-02-28得票数 0

3回答

从时间序列数据创建间隔

、

Access times可以是复制的。我正在尝试创建一个列表，其中包含分组并按命名为--给定的时间间隔，例如年份。22:00:00 314 2015-04-05 18:00:00 1我的代码示例已经创建了按年份分组的用户列表我的问题是，在这种方法中，我需要修改--表，这将成为一个百万条目表的问题。), class = "data.frame"

浏览 0提问于2018-10-10得票数 2

回答已采纳

2回答

如何在data.table中以编程方式选择列？

、、

我有以下data.table (DT)：我想通过使用存储相关变量名称的对象，以编程方式(动态地)选择变量的子集例如，我想选择存储在变量"keep“中的两列"V1”和"V3“。keep <- c("V1", "V3") 如果我们从data.frame中选择"keep“<

浏览 1提问于2013-04-25得票数 23

回答已采纳

1回答

在PostgreSQL表中插入/更新R data.table

、、

我已经设置了一个PostgreSQL数据库，其中包含一个已经定义好的表和列。表的主键是(Id, datetime)列的组合。我需要定期将不同Ids的数据从R data.table插入到数据库中。但是，如果特定(Id, datetime)组合的数据已经存在，则应对其进行更新(覆盖)。如何使用RPostgres或RPostgreSQL包完成此操作？当我尝试插入一个已经存在一些(Id，datetime)行的</em

浏览 8提问于2019-08-12得票数 3

1回答

sample()命令在R中太慢

、

我想创建一个非常大(大约200万行)的data.table df的随机子集。数据表有一个权重列wgt，它指示每行代表多少个观察值。为了生成我想要提取的行号的向量，我按照以下步骤进行：ns<- length(df$wgt)lines<-round(0.3*ns)pr<-df$wgt/s

浏览 2提问于2015-07-21得票数 1

1回答

计算日期范围间隔的部分重叠数

、、、、

我需要在一个大约15万行的数据帧上运行一个循环。但是，循环需要检查每一行，并检查数据集中每隔一行检查一次的条件。我的代码对于玩具数据集工作得很好，它产生了正确的值，但是对于我的实际数据集来说太慢了。所以我希望有人有更好的想法来解决这个问题。我尝试为包含日期范围作为数值的每一行创建列表元素，然后检查是否存在重叠，我使用%in%运算符来比较未列出的范围我使用lapply函数(这里没有显示)做过类似的事情，但同样的问题是

浏览 3提问于2019-03-26得票数 2

回答已采纳

1回答

有没有办法加快对较小的data.frames的细分

、、、

我必须频繁地对data.frame序列进行子集(每次运行数百万次)。data.frames大约大小为200行x30列。根据不同的状态，data.frame中的值从一个迭代到下一个迭代。因此，在开始时做一个子集是行不通的。与问题形成对比的是，我正在寻找data.frame/data.table的给定大小的子集的加速设置。下面的最小可重现

浏览 4提问于2017-04-10得票数 1

回答已采纳

2回答

R使用.SD时data.table聚合速度较慢

、

我正在data.table上做一些聚合(很棒的包！)我发现.SD变量在很多方面都非常有用。但是，当有许多组时，使用它会显著降低计算速度。下面是一个示例：x = data.table(id=sample(1e4,1e5,replace=T), code我应该避免使用.SD而支持单个列吗？提前谢谢。

浏览 3提问于2013-03-07得票数 15

回答已采纳

1回答

当数据表没有列时，DT::renderDataTable中的formatCurrency

、、、、

我在我漂亮的应用程序中使用renderDataTable来显示data.table $content4表的内容，该表是一个reactiveValues。可能会发生这样的情况: vals$content4table等同于一个没有列的datatable。在这种情况下，我在使用formatCurrency时出现错误，因为它搜索不存在的列。有没有办法检查datatable中是否有使用ifelse的列

浏览 19提问于2020-09-16得票数 2

1回答

使用doParallel从多个文件中分离大量数据集的有效方法

、、、

我有大量的文件，我需要读到R中，把它们放到一个数据框架中，然后被一个特定的列("pracid")分割。计算将在集群上执行。我的代码正在处理数量较少的文件，但是使用所有文件时的数据量对于R来说太大了。Data.table：：rbindlist中的错误(Dat)：列表中的总行数为3479242206，比最大行数(当前为21474833647 )要大。我还必须在另一

浏览 0提问于2020-09-11得票数 0

回答已采纳

2回答

从两个不同的数据表中获取等号行的索引。

、、

lapply(1:2,function(x) seq(S.min[x],S.max[x],S.disc[x]))Actions <- data.tableActions,c("k1","k2","i","l1","l2"))作为一个R初学者，我很难将这个示例扩展到所有列。在我的</e

浏览 5提问于2020-04-02得票数 0

回答已采纳

1回答

R条件计算日期差异

、、

我需要找出一种快速的方法来有条件地找到数据表中两个日期之间的差异，单位是天。我设法用"ifelse“语句做到了这一点，但它在大型对象上速度很慢，所以我的问题是，有没有一种更快、更优雅的方法来实现同样的目标，也许可以使用像":=”之类的data.table命令。谢谢。J. library(lubridate) a <-

浏览 22提问于2021-11-22得票数 0

2回答

使用dplyr在两个数据流中匹配时间戳

、、、

所以我有这样的数据ID timestamp value1 2018-08-0108-02 07:59:00 2018-08-02 08:50:00 2因此，我想使用mutate创建一个新的列，它会变异DF2，告诉我在startTime和endTime之间是否有任何时间出现在与ID匹配的DF1中。-08-02 8

浏览 2提问于2020-07-01得票数 3

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

data.table工程中润滑油期的不当分配

在data.table* R中遍历列*

取使用为每一行生成的布尔向量选择的行子集的平均值。

Data.table:创建新变量，按日期周期细分，按第二个变量x分组，并按每个x的最终日期聚合结果。

data.table中的Interval类

格式化24小时时间变量以捕获不同范围内的观测结果

将S4对象存储在data.frame或data.table中

从时间序列数据创建间隔

如何在data.table中以编程方式选择列？

在PostgreSQL表中插入/更新R data.table

sample()命令在R中太慢

计算日期范围间隔的部分重叠数

有没有办法加快对较小的data.frames的细分

R使用.SD时data.table聚合速度较慢

当数据表没有列时，DT::renderDataTable中的formatCurrency

使用doParallel从多个文件中分离大量数据集的有效方法

从两个不同的数据表中获取等号行的索引。

R条件计算日期差异

使用dplyr在两个数据流中匹配时间戳

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐