我有一些数据如下:
+--------+------+
| Reason | Keys |
+--------+------+
| x | a |
| y | a |
| z | a |
| y | b |
| z | b |
| x | c |
| w | d |
| x | d |
| w | d |
+--------+------+
我想要获取与每个Key
的第一次出现对应的Reason
。就像这里,我应该分别为Keys
a,b,c,d
获取Reasons
x,y,x,w
。之后,我想计算每个Reason
的百分比,就像度量每个Reason
发生的次数一样。因此,x = 2/4 = 50%.
和w,y = 25%
各不相同。
对于百分比,我认为可以使用类似于value_counts(normalize=True) * 100
的东西,基于上一步。什么是继续进行的好方法?
https://stackoverflow.com/questions/56452933
复制相似问题