首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

怎么用Python正则表达式来实现Excel文件名批量匹配?

非知之难,行之为难。

大家好,我是Python进阶者。

一、前言

前几天在Python最强王者交流群【wen】问了一个Python处理Excel数据的问题。问题如下:请教:每个文件夹下都有一个“XX公司 [2023]4234534客户清单.xlsx”的文件,我现在用os模块,if file_name.endswith('查询清单.xls')来识别,怎么用正则表达式来实现的?

二、实现过程

这里【隔壁山楂】给了一个思路,如下图所示:re.search(r'查询清单.xls$', file_name)。

顺利地解决了粉丝的问题。

后来他自己还遇到了一个问题:把csv文件修改成xlsx格式,但是输出的结果中原来的第一行没有了,所有列中数值相同的自动合并成,应该怎么设置避免这种情况呢?

后来又遇到了一个乱码的问题,他自己后来发现问题并解决了:

欣喜之余,他还分享了自己的思路:要处理一个excel表格,同一个sheet表格中含有几个不同格式的数据,怎么把不同格式的数据自动拆分,目前想到的解决方法如下:1不同格式的数据的列数是不一样的,读取每一行的数据的列数,根据列数的不同进行拆分再输出到不同的sheet。2 不用格式数据之间有空格行,根据空格行进行拆分输出到不同的sheet,最终目的是提取所有数据成统一格式的数据进行统计,目前已针对不同格式生成不同函数处理,但是分表还是手动处理。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OnauTi2k8H_3HOHqh7RqwlwA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券