我有一个180,000 x 400的数据帧,其中的行对应于用户,但每个用户正好有两行。我希望对数据进行子集,以便只保留每个用户的最新行(即每个id的date值最高的行)。我第一次尝试使用which()循环ids和sapply()中的ifelse()语句,这太慢了(我相信是O(n^2))。然后,我尝试按id对df
我有一个很大的数据帧(14,000行)。这些列包括“title”、“x”和“y”以及其他随机数据。对于特定的标题,我编写了一段代码,它基本上使用该数据的子集的x和y值执行分析(但具体细节对此并不重要)。 对于这个标题(类似于"Part number Y1-17")大约有80行。为此,我一直在用我的大数据帧制作