> 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas
前言
Excel 是奇葩不规范数据的重灾区,这主要是因为他有高度的灵活性,今天来看看一个多列堆叠问题。
案例1
公司一次线下促销活动,让运营部的小伙伴用 Excel 简单记录了商品数量,但是他们却把3天的记录分别记录在不同的列上:
你心中期望的数据是这样子的:
现在你要做各种统计数据,3天的数据手工完成当然没问题,但是如果是3个月的数据呢?
现在来看看,在 pandas 中怎么简单转换成规范的2列数据:
案例2:竖向堆叠
你可能已经注意到,上面的结果是"横向的"。也就是一行行扫过,转换成2列。
但你可能希望转换过程是竖向完成,这时我们可以这样子做:
直接看示意图吧:
你怎么这次没有给出 Excel 的解决方式啊?
因为如果我用公式解决,又不能自动化,不够灵活。
如果我用 vba ,又要自己写循环,太繁琐了。
用 pandas 不就是为了既可自动化处理,又可以少写点代码吗
总结