我想从以下数据中删除sessionid、qf和qn的重复组合
sessionid qf qn city
1 9cf571c8faa67cad2aa9ff41f3a26e38 cat biddix fresno
2 e30f853d4e54604fd62858badb68113a caleb amos
3 2ad41134cc285bcc06892fd68a471cd7 daniel folkers
4 2ad41134cc285bcc06892fd68a471cd7 daniel folkers
5 63a5e839510a647c1ff3b8aed684c2a5 charles pierce flint
6 691df47f2df12f14f000f9a17d1cc40e j franz prescott+valley
7 691df47f2df12f14f000f9a17d1cc40e j franz prescott+valley
8 b3a1476aa37ae4b799495256324a8d3d carrie mascorro brea
9 bd9f1404b313415e7e7b8769376d2705 fred morales las+vegas
10 b50a610292803dc302f24ae507ea853a aurora lee
11 fb74940e6feb0dc61a1b4d09fcbbcb37 andrew price yorkville 我将数据作为data.frame读入,并将其命名为mydata。这里是我到目前为止拥有的代码,但我需要知道如何首先正确地对data.frame进行排序。其次,删除sessionid、qf和qn的重复组合。最后是直方图中列qf中的字符
sortDATA<-function(name)
{
#sort the code by session Id, first name, then last name
sort1.name <- name[order("sessionid","qf","qn") , ]
#create a vector of length of first names
sname<-nchar(sort1.name$qf)
hist(sname)
}谢谢!
发布于 2011-12-08 05:18:56
在您的示例中,重复的行是完全重复的。unique与data.frames一起工作。
udf <- unique( my.data.frame )至于排序..。joran刚刚发布了答案。
https://stackoverflow.com/questions/8422415
复制相似问题