> 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas
前言
今天从两个需求来看看数据分列功能,由于 Excel 自带功能比较弱,在处理稍微复杂的需求时会显得力不从心,因此,本系列文章将引入 Excel 中一个非常高效的数据处理插件—— Power Query,并且看看 pandas 是怎样灵活解决。
本文结构:
Excel 分列
Excel 中对数据进行分列是非常简单的。如下:
pandas 分列
pandas 对文本列进行分列,非常简单:
复杂点的需求
有时候,我们希望分割的内容,转化成行,需求如下:
使用 Excel 自带功能处理这需求就比较困难,我们使用 Power Query 来处理:
> 请自行到官方网站下载此插件安装
那么 pandas 中怎么实现这需求:
> 注意,explode 方法是 pandas 0.25 版本的新增方法
提升难度
假如现在有多列需要进行分割展开呢?如下:
直接看 pandas 怎么解决:
虽然实现了,但代码的语义不够清晰。编程语言的灵活性在此可以充分体现,我们把逻辑封装成一个函数 hp_explode ,以后需要使用时,简单调用即可:
> hp_explode 方法的定义不是本文的核心,需要源码的小伙伴看文末
不想调用 .str.split ?当然也支持:
总结