我想通过一个变量对我的数据框进行分组,汇总另一个变量,但保留所有其他相关列。在Applying group_by and summarise on data while keeping all the columns' info中,公认的答案是使用filter()或slice(中,公认的答案是使用您希望保留的所有列作为分组变量的一部分。但是,如果您想保留许多列,这似乎是一个无效的解决方案。例如,我正在处理的数据有26个附加列
我有一个包含5713行和7列的数据帧。许多行是重复的。我需要按“性别”和“大小”创建5个组,同时确保“项目”列不包含重复项,而“类型”列仅包含最多1个“羊毛衫”。我尝试过sample,split,group_by,sample_n,但似乎想不出如何包含所有变量。3 M M MBAN理想情况下,我希望创建一个