我有一个很长的数据格式的列:
id gender size region_a_count region_b_count item_group
x m x x x x
x f x x x x
x f x x x x
x m x x x x
x f x x x x
x m x x x x
性别、大小、item_group和区域的每一种组合都是独特的。因此,不需要执行聚合。
我希望将索引和列重新索引到这种类型的输出,单元格值保持不变。
region_a region_b region_c
m f m f m f
(index of size)
item_group 1
2
3
item_group 1
2
3
也就是说,索引和列具有多个索引。我能够通过调用以下命令来执行索引的部分:
df.groupby(["item_group","size"])
但列问题仍然存在。
如何从现有的dataframe创建列多个索引?
发布于 2018-10-24 12:40:47
我相信你需要set_index
和unstack
df1 = df.set_index(["item_group","size", "id","gender"]).unstack()
https://stackoverflow.com/questions/52969126
复制相似问题