假设我有一只名叫df的熊猫DataFrame,它看起来像这样
father_name child_name
Robert Julian
Robert Emily
Robert Dan
Carl Jack
Carl Rose
John Lucy
John Mark
John Alysha
Paul Christopher
Paul Thomas
Robert Kevin
Carl Elisabeth我确信每个父亲都有,至少有两个孩子。
我想要一个DataFrame,在这里,每个父亲都有他的两个孩子的,而这两个孩子是随机选择的。一个示例输出将是
father_name child_name
Robert Emily
Robert Kevin
Carl Jack
Carl Elisabeth
John Alysha
John Mark
Paul Thomas
Paul Christopher我怎么能这么做?
发布于 2018-12-21 21:07:43
可以对分组数据应用DataFrame.sample。它采用参数n,可以设置为2。
df.groupby('father_name').child_name.apply(lambda x: x.sample(n=2))\
.reset_index(1, drop = True).reset_index()
father_name child_name
0 Carl Elisabeth
1 Carl Jack
2 John Mark
3 John Lucy
4 Paul Thomas
5 Paul Christopher
6 Robert Emily
7 Robert Julianhttps://stackoverflow.com/questions/53890742
复制相似问题