经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas
Excel 的表格是以灵活为主,也因此造就各种数据灾难现场。今天来看看怎么填补有意义的空白单元格,并且对应的 pandas 方法。
如下一份销售人员记录表:
好吧,幸好你已经长时间接受这种非人的锻炼,打开 Excel,定位 + 等号 + 批量写入,轻松解决:
你为了展示 Excel 功力,全程使用快捷键,一切尽在不知不觉中解决问题:
啪!!!!白日梦做完了,你的同事一言不合给你扔了 n 个同样"时尚简约"的表格。那不是要手残了?!
幸好,你想起来昨晚看到这一篇文章刚好说到是如何用 pandas 解决
对于 pandas 来说,Excel 中的这些空单元格,加载后全是 nan:
要填补这些眼花缭乱的 nan,只需要一个方法:
但是,调用一个方法还要写上这么多字母,手残党怎么办?pandas 不会让你失望:
别小看 pandas 这么一个小方法,他可以做几乎应对所有填"坑"的场景,比如,直接填个值,大声告诉所有人,"我是空白,我骄傲!":
当然,与普通的表格方法差不多,能通过 axis 参数控制填充方向:
你会说,填坑到底为了啥?
其实很多时候这些坑来源于合并单元格,比如原来的表格是这样子:
看完这文章,你不就非常容易搞定事情了吗: