我有一个来自IMDB的数据框架,看起来像这样。不幸的是,它没有被分组,但我希望我可以把它变成R组。
数据如下所示:
V1 V2 starts_with
NM: Aarons Alex NM
DB: 15 May 1890 Philadelphia DB
NM: Aarons Leroy NM
NM: Aarons Shawn NM
DB: 26 March 1989 Jamaica DB我想要的是添加一个新列。基于NM和DB组合的序列。每有一个新的"NM“,就会有一个新的数字:
V1 V2 starts_with group
NM: Aarons Alex NM 1
DB: 15 May 1890 Philadelphia DB 1
NM: Aarons Leroy NM 2
NM: Aarons Shawn NM 3
DB: 26 March 1989 Jamaica DB 3当然,我搜索了一下,看到了这个generate sequence within group in R,但是这个例子已经被分组了。不幸的是,我的数据没有分组。
发布于 2019-05-22 04:54:42
您可以使用cumsum
df$group = cumsum(df$starts_with == "NM")https://stackoverflow.com/questions/56246162
复制相似问题