在下面的示例中,我尝试使用missForest来估算缺失值。为了加快这个过程,我使用了foreach包。其中我使用了100棵树,然后将这些树传递给了missForest函数。这是并行missForest的正确方式吗?
下面是示例和我所做的工作:
library(foreach)
library(missForest)
data(iris)
iris.na <- iris
set.seed(111)
## artificially drop some data values.
for (i in 1:4) iris.na[sample(150,
我的数据集有9万多条记录。日期格式如下:
timestamp
2018-01-27T09:01:49Z
2018-01-27T00:04:08Z
2018-01-27T09:04:22Z
2018-01-27T09:04:28Z
2018-01-27T00:07:38Z
我试过了
as.Date(recfive$timestamp, "%Y/%m/%d %H:%M:%S")
我得到了所有的NA
[1] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
我想测试xts对象的最后一行的日期是否等于当前日期。我的问题是,last(index(obj))返回Sys.Date()函数不返回的时区信息。
> last(index(obj))
[1] "2016-09-16 UTC"
> Sys.Date()
[1] "2016-09-16"
我的解决办法是paste0、Sys.Date()和Sys.timezone(),但这并不优雅。有没有更好的解决办法?
# Test if we already have data
if (last(index(obj)) == paste0(Sys.Date(),
我使用的是R编程语言。我正在尝试计算两个日期列之间的差异。两个日期的格式如下: 2010-01-01 12:01 当我把我的文件放到R中时,日期是"Factor“格式。下面是我在R中重新创建文件的尝试: #how my file looks like when I import it into R
date_1 = c("2010-01-01 13:01 ", "2010-01-01 14:01" )
date_2 = c("2010-01-01 15:01 ", "2010-01-01 16:01" )
file
我试过:
test <- "11feb2022 00:00:00"
as.POSIXct(test, format="%dd%mm%YYYY")
[1] NA
test <- "11feb2022 00:00:00"
as.POSIXct(test, format="%d%m%Y")
[1] NA
但是我想要一些关于从这里往哪里去的提示。谢谢。
下面是一个虚构的、可再现的四辆出租车上落次数的例子.不幸的是,出租车1、2和3在时间上丢失了.幸运的是,其中两次(对于出租车1和3)可以推断出在他们接新顾客之前至少有1秒的时间(这两次都是非共乘出租车,非常防日冕):
(在实际用例中,下面的df是group_by的结果和另一个df的摘要)
library(dplyr)
x <- seq(as.POSIXct('2020/01/01'), # Create sequence of dates
as.POSIXct('2030/01/01'),
by = "10
我准备了一个按日期和时间as.POSIXlt订购的数据框架:
Date_Time A1 B2 C1 E2
46 24/06/2012 12:20:00 NA 5.515 20 NA
47 24/06/2012 13:20:00 41 NA NA 3.519
48 25/06/2012 14:00:00 NA NA NA NA
49 25/06/2012 14:20:00 30 NA 30 NA
50 27/06/2012 15:20:00 NA 71 NA NA
51 28/06/2012 18:00:00
我有一张1985年的日期列表(每小时):每一天都有24小时。我的对象是fg,下面是一个例子:
fg
"1985-01-01 00:30:00 GMT" to "1985-01-01 22:30:00 GMT" then NA # (NA here should be "1985-01-01 23:30:00 GMT")
"1985-01-02 00:30:00 GMT" to "1985-01-02 22:30:00 GMT" then NA # (NA here should be "1985-0
我已经搜索过,但无法找到如何从格式化如下的字符串中转换日期:
date <- "07-21-2015-09:30AM"
我想使用as.Date,但我没有设法使用。我得到的只有以下几点:
as.Date(date, format="%m-%d-%y-%hAM")
NA
as.Date(dates, format="%m-%d-%y-%h")
NA
我正在回顾R中的多种估算方法,我遇到了一个基本但重要的问题。在下面的脚本中,数字7在数据4:10,3 <- rep(NA,7)中起什么作用?它是告诉R重复NA七次吗?
library(mice)
library(Amelia)
library(mi)
library(missForest)
library(Hmisc)
library(mi)
data <- airquality
data[4:10, 3] <- rep(NA, 7) # rows 4 through 10, third column, make it NA
data[1:5, 4] <- NA #
我正在使用pivot_longer将我的数据从宽到长的格式重塑为多个值列。我知道有相关的问题(Pivot_longer 6 columns to 3 columns或Tidy dataset with pivot_longer: Multiple columns into two columns),但到目前为止我还找不到解决方案,可能是因为我的两个列属于不同的类,第一个列是POSIXct,第二个列是numeric。 下面是一个最小的工作示例: structure(list(compid = c("AT9130162999", "AT9090003478"
我有下面的代码块,我试图通过将其连接到一个时间序列来填充我的数据df_stuff中缺失的分钟数,该时间序列包含一整年的所有分钟。实际上,我希望以15分钟为间隔聚合此数据,而不是分钟。有没有人知道一种简单的方法?我正在查看xts包中的to.minutes15,但它似乎与我的POSIXct格式时间序列有问题。
代码:
library("sqldf")
##Filling Gaps in time by minute
myTZ <- "America/Los_Angeles"
tseries <- seq(as.POSIXct("2015-01-
我想在与a变量具有相同类型的变量中插入NAs。因此,对于可以拥有任何类的变量x,我希望生成同一个类的NAs。as(NA, class(x))除了POSIXct什么都做得很好
> x = as.POSIXct("2021-01-01")
> as(NA, class(x))
Error in class1Def@contains[[class2]] : no such index at level 1
同样的情况也适用于:
> x_na = NA
> class(x_na) = class(x)
> identical(x_na, lubridate