相信有不少朋友日常工作会用到 Excel 处理各式表格文件,更有甚者可能要花大把时间来做繁琐耗时的表格整理工作,今天我们就通过Python实现对表格的自动化整理。
首先我们有这么一份数据表 source.csv:
我们要做的是从上表中提取数据,来生成一份符合以下要求的表格:
按照以下分组名单 group.xls 来整理数据表中的数据:
最终要展现的数据项:
其中“K数据/60”为数据表中的“数据K”/60后保留的2位小数
常规方法Excel 如何处理以上需求:要在source.csv 数据表中读取每条数据,放入 group.xls 匹配的分组成员中,最后筛选需要的数据项,再对特定的 “数据K”进行运算处理。
那么 Python 又将如何操作呢?这里我们要用到功能强大的 pandas 库。
导入 pandas 库,通过相关的函数读取 csv 和 xls 表格内容:
mport pandas as pd
# 读取 group.xls 分组信息
group = pd.read_excel("group.xls",header=None)
group.columns=["分组","角色"]
print(group)
# 读取 source.csv 获取所有成员数据
source = pd.read_csv("source.csv")
print(source)
首先对 source.csv 中的数据项进行筛选,需要的数据项有“角色”、“编号”、“数据B”、“数据C”、“数据D”和“数据K”:
# 通过 iloc[:,[列坐标]] 来定位需要的各列数据
filter_merge = source.iloc[:,[0,2,4,5,6,13]]
print(filter_merge)
根据分组角色来匹配角色数据,注意到 group.xls 和 source.csv 共有“角色”一项,我们可以通过此项将两个表格融合从而形成匹配填充的效果。
combine = pd.merge(group,filter_merge,on="角色")
在第二列插入运算后的“数据K/60”:
combine.insert(1,"数据K/60",round(filter_merge["数据K"]/60,2))
将生成的数据格式写入新的 xlsx 表格中:
combine.to_excel(excel_writer="result.xlsx",index=False)
最终自动生成的表格如下:
以上便是 Excel 表格整理的 Python 代码简单实现,在操作过程中也遇到几个问题贴在这里供大家参考:
导入 pandas 时可能会报错!解决:根据报错信息安装需要的相关模块
要进行表格整理的电脑为公司电脑、无法连接外网下载 Python!解决:先在外网电脑下载 Python 安装文件以及相关的模块安装文件,拷贝到无网络电脑进行安装
以上表格整理的实例在现实工作有参考意义么:回答:文中表格的原型是一份员工工作记录,根据人员分组进行相关的数据统计。类似的分组统计成员数据都可以根据此简单 Python 模板来实现。
领取专属 10元无门槛券
私享最新 技术干货