首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何根据Pandas中自己的排序思想,根据重复值的字符串列对DataFrame进行排序?

如何根据Pandas中自己的排序思想,根据重复值的字符串列对DataFrame进行排序?
EN

Stack Overflow用户
提问于 2022-10-18 17:22:35
回答 1查看 28关注 0票数 1

我在Pandas中有DataFrame,如下所示:

代码语言:javascript
复制
COL1  | COL2 | ...  | COLn
------|------|------|-------
aaa   | AA_x | ...  | ...
bbb   | AA_x |  ... | ...
ggg   | AA_x |  ... | ...
ppp   | AA_x |  ... | ...
aaa   | DD_x |  ... | ...
ggg   | DD_x | ...  |  ...
ppp   | DD_x |  ... | ...
bbb   | DD_x |  ... | ...
....  | ...  | ...  | ...

COL1是字符串数据类型,我需要根据自己的想法(如:aaa,bbb,ppp,ggg )对基于DataFrame的COL1值进行排序,因此我需要如下所示:

代码语言:javascript
复制
COL2   | COL1  | ...   | COLn
-------|-------|-------|------
AA_x   | aaa   | ...   | ...
AA_x   | bbb   | ...   | ...
AA_x   | ppp   | ...   | ...
AA_x   | ggg   | ...   | ...
DD_x   | aaa   | ...   | ...
DD_x   | bbb   | ...   | ...
DD_x   | ppp   | ...   | ...
DD_x   | ggg   | ...   | ...
...    | ....  |  ...  |...

我怎么能在Python Pandas中做到这一点呢?我假设手动叫喊被排序,这个DataFrame?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2022-10-18 18:03:55

IIUC,您希望按COL1进行排序,并保持相对aaa/bbb/等的原始顺序。

您可以使用:

代码语言:javascript
复制
order = ['aaa', 'bbb', 'ppp', 'ggg']

df['COL1'] = pd.Categorical(df['COL1'], categories=order, ordered=True)

out = (df.assign(n=df.groupby('COL1').cumcount())
         .sort_values(by=['n', 'COL1'])
         .drop(columns='n')
       )

如果您已经有了一个用于排序的次要列(例如。COL2):

代码语言:javascript
复制
order = ['aaa', 'bbb', 'ppp', 'ggg']

df['COL1'] = pd.Categorical(df['COL1'], categories=order, ordered=True)

out = df.sort_values(by=['COL2', 'COL1'])
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/74115029

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档