在R中的lubridate中处理大型数据集中日期的高效计算方法_将因子列转换为R中数据集中的日期_在R中合并数据集中的行时求和 - 腾讯云开发者社区

r、date、lubridate、processing-efficiency

我有看起来像这样的数据，但是有2000万行。A)计算截至2019年12月31日的老年人年龄，并将其划分为年龄组 B)移走年龄或死亡日期不可能的人这就是我运行的代码来做这件事 #Change the missing dates of death，但它只是在2000万行数据上不停地运行。我想知道是否有更高效、更快的处理日期的方法？我还想知道我是否有不能解析的<em

浏览 8提问于2020-11-06得票数 0

回答已采纳

1回答

极稀疏矩阵的推荐系统

r、recommender-system

我正试图建立一个基于大型和非常稀疏矩阵的推荐系统。该矩阵的维数大约为12000×37000，甚至可能会有更多的行数到100000行。然而，这个矩阵是非常稀疏的。在12000x37000版本中，大约0.053%的矩阵是非NA的.我试过SVD了，但是没有用。拆分成测试和验证集，将"NA“替换为0，减去每一行的行表示，将"svd”包中的propack.svd应用到该矩

浏览 0提问于2017-09-11得票数 0

回答已采纳

1回答

使用lubridate格式化多个日期样式时出错

r、date、formatting、lubridate

我正在格式化一个列，其中包含记录的日期。在专栏中，日期有很多种格式，我需要将它们转换成一种一致的格式。Date.of.Record 20180102 2018-01-04 library(lubridate</em

浏览 0提问于2019-05-19得票数 1

回答已采纳

5回答

我想将两个变量合并为一个具有日期格式的变量

r、date、datetime、time

我有一个数据集，其中包含一个表示月份的字符列(MONTH)和一个表示年份的数值列(YEAR)。为了将其作为面板数据使用，我需要将这些YEAR和MONTH合并到一个具有日期格式的变量中。R不会将其识别为日期变量。它目前看起来是这样的： STATE MONTH YEAR VALUECalifornia

浏览 43提问于2019-01-25得票数 1

回答已采纳

1回答

data.table函数可以动态操作日期和时间列吗？

r、data.table、lubridate

我记不清日期了。我喜欢用润滑剂。在我的许多数据集中，我都有日期或日期和时间，并使用lubridate来处理它们。Lubridate将instant存储为POSIX类。我在这里看到了创建新变量的答案，例如，只是为了获得年份，例如。2005年。我不喜欢那样。有些时候我会按年分析，有些时间按季度分析，有些时间按月分析，有些时间按持续时间分析。我想做一些这样简单的事情 mydatatabl

浏览 0提问于2011-11-22得票数 2

回答已采纳

1回答

pandas2ri.ri2py_dataframe(r_dataframe)返回浮点数，而不是ISO-8601 (YYYY-MM-DD)格式的日期。

python、r、pandas、dataframe

代码input_dataframe_r)问题描述我在Python中有一个，我想对它做一些R运算。因此，我接受input_dataframe的一个参数，即Pandas，做一些事情(在本例中它是一个名为r_generate

浏览 3提问于2018-05-15得票数 1

回答已采纳

3回答

检查proc追加是否成功

error-handling、sas

我有一些代码，它将昨天的数据附加到大型数据集中，使用proc追加。这样做后，它会将另一个数据集中的变量"latest_date“的值更改为昨天的日期，从而在没有耗时数据步骤或proc的大型数据集中显示最大日期值。如何在使用proc追加的同一程序中检

浏览 0提问于2018-02-27得票数 1

回答已采纳

2回答

使用纯R处理dbplyr的日期

r、dplyr、dbplyr

dbplyr将dplyr和基R命令转换为SQL，这样开发人员就可以编写R代码并在数据库()中执行它。在R中使用日期时，通常使用lubridate包。然而，目前还不存在用于lubridate函数的dbplyr翻译。因此，使用dbplyr的开发人员需要找到处理日期的替代方法。这让我不禁要问：，只有在连接到远程数据库

浏览 0提问于2021-04-04得票数 2

回答已采纳

1回答

将经过时间的变量切割为可管理的事物

flight_time 19:37:06我在处理数据集中的时间播放变量时遇到了问题。我似乎想不出如何让R把这个值当作一个数字来处理。我阅读了lubridate包文档，因为我想执行算术操作(如果这是正确的术语)，所以我相信工期函数是正确的。但是，看看这些示例--我不完全确定将其应用于大型(Ish)数据中

浏览 1提问于2015-05-20得票数 2

回答已采纳

1回答

抽样随机点更接近今天？

r、sample

我在R中有这个数据集：var1 =) question_data$id = 1:nrow(question_data) 我想从这些数据中随机抽取1000个样本，这样“与开始<em

浏览 2提问于2022-08-13得票数 -1

1回答

如何在R Shiny中添加日期过滤器？

r、filter、shiny、shinydashboard、datefilter

有没有人能帮帮我，我不知道如何过滤约会的内容？我不知道如何实现这一点。我不知道怎么把这两个好的面板放在一起。不管我怎么试，看起来都很可怕。致以亲切的问候！),file=file,append=TRUE) ) } shinyApp(ui, server) 我希望我的问题足够清楚他们想让我添加更多的文本/细节，但我不认为删除内容会让它更好地遵循。

浏览 15提问于2020-04-05得票数 0

1回答

guess_formats重复载体

r、lubridate

你好，亲爱的，知识渊博的R大师和斯塔克威夫花，library(lubridate) x <- c("2014-01-18 00:00:00","2015-03-01 00:00:00

浏览 0提问于2018-05-16得票数 2

回答已采纳

1回答

如何将此日期格式转换为lubridate接受的格式？

r、excel、datetime、lubridate

我已经从带有readxl包的Excel表中导入了R中的数据。# A tibble: 1 x 1 <dttm>

浏览 2提问于2020-04-16得票数 0

回答已采纳

1回答

流苏时间不能处理chron时间

r、lubridate、chron

我试图从R.中的chron时间中提取出这个小时，对lubridate::hour的帮助如下： library(chron)hour(chron(times. = "01:02:03"))Error in as.POSIXlt.default我知道使用chro

浏览 3提问于2015-12-07得票数 1

回答已采纳

1回答

作为存储函数的data.table列赋值

r、data.table

我有一个R包中的表，我正在编写，它非常大。为了减小分配的大小，我从表中去掉了所有可以从其他列计算得到的列。例如，星期几可以从日期计算出来，所以我从包数据集中省略了星期几。但是，我想让使用该包的任何人都能方便地以标准方式重新计算这些列。为了提高效率，我想使用data.table就地赋值。我的想象是这样的： dt = myPackageData # minimal data set

浏览 0提问于2017-06-20得票数 0

2回答

如何在R中将05/02/1953改为1953 (即，将dd/mm/yyyy改为yyyy)？

r、date、datetime、date-formatting

我正在尝试比较两个基于时间的数据集。一个简单地以“yyyy”格式写成年份，而另一个则写成“dd/mm/yyyy”。有没有办法把所有这些都转换成简单的年份格式？

浏览 28提问于2020-02-08得票数 0

4回答

在一些最近的日期条目在出生日期之前的大型数据集中计算年龄

如何通过排除最近日期在出生日期之前的条目来计算大型数据集中的年龄?这些条目可能是由于r dob<-c("02/02/2005"，"12/04/2005"，"18/06/2006"，"22/06/2007"，"04/08/2002"，"15&

浏览 30提问于2017-05-12得票数 0

回答已采纳

1回答

如何将数据集定义为R中的每日时间序列数据集？

r、time-series

我目前正在对数据集进行分析。数据集如下所示：如果有人知道如何做到这一点，那我们将不胜感激。最诚挚的问候:)

浏览 2提问于2022-01-11得票数 0

2回答

将一个月加到一个日期

r、dataframe、date、xts、zoo

我希望通过向startDate添加一个月来获得endDate和startDate之间的日期序列。ie，如果startDate是2013-01-31，而endDate是2013-07-31，我更希望看到这样的日期：我试过了 seq.Date(as.Dat

浏览 3提问于2013-07-16得票数 11

回答已采纳

2回答

如何将函数应用于dataframe中的特定列并替换原始列？

r、dplyr、tidyverse、lubridate

我有一个包含医学数据(my.medical.data)的大数据。如果有一个通用解决方案，可以使用任何函数，而不仅仅是我的dmy()示例，那就太好了。基本上，我想将以下内容应用于我的所有日

浏览 3提问于2020-04-03得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云