一、前言
前几天遇到了一个小需求,粉丝自己在实际工作中的需求,需要把下图的表格内容,自动填充到目标表格中去,省得挨个去复制粘贴了,而且还十分容易出错。
原始表格如下图所示:
目标表格如下图所示:
上一篇文章中我们谈到了单个文件的处理,如果现在粉丝有几十个这样的同类Excel文件需要处理,那么该怎么来修改代码呢?
这里【枫涧澈浪】大佬给了一个代码,如下所示:
# -*- coding: utf-8 -*-
__author__ = 'Jason.Fan'
import pandas as pd
import re
import os
import glob
rawXls='模板.xls' #要处理的表格文件
resXls= 'res.xls' #要生成的文件
rerule = r"(\d{4}-\d{1,2}-\d{1,2})"
resDict = {}
class SheetInfo:
name = ''
ID = ''
age = ''
date = ''
def main_sub(rawXls,resXls):
df = pd.read_excel(rawXls)
# print(df.head())
# print(df.iloc[0,0])
# print(df.columns)
# print(Get_CellContent('模板.xls','Sheet4',['姓名'],0))
SheetInfo.name = df.columns[1]
SheetInfo.ID = df.iloc[0, 1]
SheetInfo.age = df.iloc[1, 1]
SheetInfo.date = re.findall(rerule, (df.iloc[1, 2]))[0]
print(SheetInfo.name, SheetInfo.ID, SheetInfo.age, SheetInfo.date)
resDict['日期'] = SheetInfo.date
resDict['姓名'] = SheetInfo.name
resDict['ID'] = SheetInfo.ID
resDict['年龄'] = SheetInfo.age
ndf = df.iloc[4:, :]
ndf.columns = range(6)
for idx, v in ndf.iterrows():
print(v[0], v[2], v[3])
#核心内容pass
# print(resDict)
finalDF = pd.DataFrame.from_dict(resDict, orient='index').T
finalDF.to_excel(resXls, index=None)
# os.system(resXls)
def main():
for fi in glob.glob('*.xls'):
if '_res' in os.path.basename(fi): continue
main_sub(fi,'{}_res.xls'.format(os.path.basename(fi)))
if __name__ == '__main__':
main()
代码运行之后,该文件夹下的所有Excel表格都可以处理成功,可以得到预期的效果。
大家好,我是皮皮。这篇文章主要盘点了一个Python
自动化办公处理的问题,实现文件的批量处理,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题
往期精彩文章推荐:
本文分享自 Python爬虫与数据挖掘 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!