如果你想做一个数据透视表而不把索引作为多索引返回,该怎么办呢?
df = pd.DataFrame({'A': ['A', 'B', 'A', 'B', 'A', 'B', 'B', 'B'],
'B': ['Male', 'Female', 'Male', 'Male', 'Female', 'Male', 'Female', 'Female'],
'C': ['1-5', '6-10', '1-5', '6-10', '1-5', '6-10', '1-5', '6-10']})
如果您使用pivot_table
(这里的margins=True也会导致错误):
df.pivot_table(index=['A','B'],
columns='C',
aggfunc='size',
fill_value=0)
这将返回:
C 1-5 6-10
A B
A Female 1 0
Male 2 0
B Female 1 2
Male 0 2
但是我正在寻找this输出:
var_name
C 1-5 6-10 All
value
A 3 0 3
B 1 4 5
Female 2 2 4
Male 2 2 4
All 8 8 16
肯定有一种使用pivot_table
、pivot
或crosstab
的更简单的方法,而不是先进行熔化,然后进行pivot_table
,如下所示:
(df.melt(id_vars=['C'],value_vars=['A','B'],var_name='var_name').pivot_table(index=['value'],
columns=['type'],
aggfunc='count',
fill_value=0,
margins=True))
发布于 2020-12-11 20:50:29
DataFrame.melt
和crosstab
的一个类似想法与您的解决方案类似:
df = df.melt(id_vars=['C'],value_vars=['A','B'],var_name='var_name')
df = pd.crosstab(df['value'], df['C'] ,margins=True)
print (df)
C 1-5 6-10 All
value
A 3 0 3
B 1 4 5
Female 2 2 4
Male 2 2 4
All 8 8 16
我认为在pandas中不存在一个函数,因为需要先通过melt
取消旋转,然后使用pivot
。
https://stackoverflow.com/questions/65251518
复制相似问题