我有一个示例表,如下所示:
|col_1|col_2|col_3|
|---|---|---|
|dog|cat|bike|
|cat|bike|dog|
|NaN|car|NaN|
在pandas中,有没有什么方法可以重新排列每一行的列值,使所有相同的值都在相同的列中,如下所示:
|col_1|col_2|col_3|col_4|
|---|---|---|
|dog|cat|bike|NaN|
|dog|cat|bike|NaN|
|NaN|NaN|NaN|car|
缺少的值应替换为NaN。谢谢。
发布于 2019-06-09 22:06:25
这更像是一个get_dummies
问题
s=df.stack().str.get_dummies()
yourdf=s.sum(level=0).mul(s.columns)
yourdf
bike car cat dog
0 bike cat dog
1 bike cat dog
2 car
https://stackoverflow.com/questions/56518585
复制