这个问题来源于自己Python交流群中的一个问题,如下图所示,需要计算每列中各值的出现次数,然后组成一个新的表。
计算每列各值的出现次数,我们可以使用groupby方法,当然最简单的还是使用value_counts方法。
import pandas as pd
data = pd.read_excel('例子.xlsx',sheetname='Sheet1',index_col='index')
frames = []
for i in data.columns:
s = data[i].value_counts().sort_values()
d = pd.DataFrame({'列名':i,'变量名':s.index,'次数':s.values})
frames.append(d)
result = pd.concat(frames)
result
这样,就可以通过不到10行的代码就可以优雅的解决群友的问题啦,不得不说Python以及pandas的强大了。