我有以下数据集df
name draught nav_status date
A 22 0 24/12/2014
A 22 0 25/12/2014
A 11 5 26/12/2014
A 11 1 27/12/2014
B 22 0 24/12/2014
B 22 0 25/12/2014
B 22 0 26/12/2014
B 22 5 27/12/2014
B 9 0 28/12/2014
B 22 0 29/12/2014从这个数据集中,我需要提取列表中每个对象的唯一吃水值。
我对R相当陌生,并做了以下尝试
y <- subset(df,!duplicated(df[,draught]),)和
Dup <- function(x){
x <- x[!duplicated[x$draught],]
y <- lapply(df, Dup)但是这会删除整个数据的吃水条目。我查阅了一些关于分割应用和组合技术的文献,并尝试了这些选择。请提供一些指导,文献,以解决这一问题。
结果应该是
name draught nav_status date
A 22 0 24/12/2014
A 11 5 26/12/2014
A 11 1 27/12/2014
B 22 0 25/12/2014
B 9 0 28/12/2014我甚至试图通过顺序排列和删除重复条目,根据第一项和最后一项对数据进行subset,但是data.Thank you却丢失了!!
发布于 2016-02-25 07:34:03
使用data.table库,您可以通过以下方法获得结果:
library(data.table)
dt <- as.data.table(df)
unique(dt, by = c('name', 'draught'))不过有一件事。为什么你在你想要的结果中有两个一对A- 11的条目?
https://stackoverflow.com/questions/35605681
复制相似问题