因此,我有以下12个月的数据:
当我使用pd.get_dummies
对其进行一次热编码时,结果是:
您可以看到,新列是按字母顺序排列的,因此难以读取数据。有什么办法维持秩序吗?
发布于 2022-10-27 12:50:21
一种选择是使用虚拟变量创建一个单独的dataframe,重新排序它,并将它与原始的dataframe连接起来。
df = pd.DataFrame({'month': ['jan', 'feb', 'jan', 'march', 'jan']})
dummies = pd.get_dummies(df.month)
dummies = dummies[['jan', 'feb', 'march']]
pd.concat([df, dummies], axis=1)
https://datascience.stackexchange.com/questions/115628
复制相似问题