用Python批量读取excel并提取各单元格信息并填入新的excel

上周接了一个新任务,需要把大批量的excel格式的数据录为格式化数据。

数据大概长这样:

然后需要提取19个信息分别填入新的excel里结构化。

本来甲方说让人工录,我瞅了瞅,说干脆用Python吧。

于是花了一晚上时间写了200行代码实现了。

之前有个好基友是:

从病理系统中批量获取Gleason评分并填入Excel

用的是[xlutils模块],

我用的是 xlrd 和 xlwt,一个是读取,一个是写入。

用xlrd读 取excel是不能对其进行操作的:xlrd.open_workbook()方法返回xlrd.Book类型,是只读的,不能对其进行操作。而 xlwt.Workbook()返回的xlwt.Workbook类型的save(filepath)方法可以保存excel文件。因此对于读取和生成Excel文件都非常容易处理,但是对于已经存在的Excel文件进行修改就比较麻烦了。不过,还有一个xlutils(依赖于xlrd和xlwt)提供复制excel文件内容和修改文件的功能。其实际也只是在xlrd.Book和xlwt.Workbook之间建立了一个管道而已,如下图:

实现方法就是先获取文件夹下所有文件的名字,然后一一打开,分别提取信息后写入汇总的excel的对应框下,旧的excel关闭,打开新的excel,继续提取信息写入汇总的excel。

基本上就是靠百度就完成了。因为不想搞太复杂,用的也是很简单粗暴的方法。

比如把E列里的三个信息分别提取出来填到对应的excel单元格下,就用了很low的拼接办法。

没事,能解决问题就行。

最后统计一下一共录入了多少行信息,即可。

还有例如是处方金额下的那个数字也需要获取,所以也是简单粗暴的遍历F列,碰到‘处方金额’后提取下一行的数字。

总的来说,Python确实是个好工具,方便快捷,真是人生苦短,我用Python。

编程有机会大家还是学一下比较好的,不难,网上教学视频一大把,看看视频看看书,找几个简单的小任务做一做,很快就上手了。

当然想精通并不容易,不过学会简答操作后,以往困难的东西都可以很简便的实现,还是很有成就感的,最起码,比女孩子好追多了。

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20171211B009WG00?refer=cp_1026

扫码关注云+社区