我有看起来像这样的数据,但是有2000万行。A)计算截至2019年12月31日的老年人年龄,并将其划分为年龄组 B)移走年龄或死亡日期不可能的人 这就是我运行的代码来做这件事 #Change the missing dates of death,但它只是在2000万行数据上不停地运行。我想知道是否有更高效、更快的处理日期的方法? 我还想知道我是否有不能解析的<em
我有一个R包中的表,我正在编写,它非常大。为了减小分配的大小,我从表中去掉了所有可以从其他列计算得到的列。例如,星期几可以从日期计算出来,所以我从包数据集中省略了星期几。但是,我想让使用该包的任何人都能方便地以标准方式重新计算这些列。为了提高效率,我想使用data.table就地赋值。我的想象是这样的:
dt = myPackageData # minimal data set