大家好,我是Python进阶者。
前几天在Python星耀交流群有个叫【iLost】的粉丝问了一个关于使用pandas解决两列数据对比的问题,这里拿出来给大家分享下,一起学习。

大概意思是说在DF中有2列数据,想每行取两列数据中的最大值,形成一个新列,该怎么写?最开始【iLost】自己使用了循环的方法写出了代码,当然是可行的,但是写的就比较难受了。

这里给出5个方法,感谢大佬们的解答,一起来看看吧!
其实这个题目的逻辑和思路也相对简单,但是对于Pandas不熟悉的小伙伴,接受起来就有点难了。
df['max1'] = df[['cell1', 'cell2']].max(axis=1)
df

这个方法是才哥群里【广深-运营-n】大佬给的方法。

代码如下,亲测可行。
df['max2'] = df.loc[:,['cell1','cell2']].max(axis=1)
df

apply方法是最开始想到的方法,但是不知道怎么写,还好有【月神】,这里使用apply方法来解决,代码如下
df['max3'] = df[['cell1', 'cell2']].apply(max, axis=1)
df

这个方法也是才哥群里的一个大佬给的思路。

亲测可行,代码如下:
df = df.assign(new=df[['cell1', 'cell2']].max(1))

这里的用法需要注意下,不然容易翻车:

细节拉满:

这个方法也是才哥群里的一个大佬给的思路。

使用numpy结合pandas,代码如下:
df['max4'] = np.where(df['cell1'] > df['cell2'],df['cell1'], df['cell2'])
df

真是太秀了。
大家好,我是Python进阶者。这篇文章基于粉丝提问,针对df中,想在每行取两列数据中的最大值,作为新的一列问题,给出了具体说明和演示,一共5个方法,顺利地帮助粉丝解决了问题,也帮助大家玩转Pandas,学习Python相关知识。
最后感谢粉丝【iLost】提问,感谢【月神】、【dcpeng】、【北京-算法-浩浩】、【上海-数分-长城】、【广深-运营-n】、【常州-销售-MT】大佬们给出的示例和代码支持,感谢【冯诚】、【凌云剑圣】、【PI】、【艾希·觉罗】、【猎影】等人参与学习交流。
本文分享自 Python爬虫与数据挖掘 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!