今
日
鸡
汤
春草碧色,春水渌波,送君南浦,伤如之何!
大家好,我是Python进阶者。
前几天在Python最强王者交流群【鶏啊鶏。】问了一个Python处理PDF数据的实战问题。问题如下:
大佬们 想请教下有什么处理pdf的库可以删pdf指定文本的内容以及调整文本内容吗,都是文字型的PDF。文件因为安装了加密系统没法发出,查了下一些库的介绍似乎更多是读内容 删页 合并拆分等。
这里【瑜亮老师】给了一个思路:你自己用word制作内容,然后转成pdf,发到群里不就行了?把想要删除的部分框选好,最好是有原文件+处理后的结果文件,这样更一目了然 顺利地解决了粉丝的问题。
【瑜亮老师】:盲猜,实现思路是使用python-docx模块把文字版的pdf转成word,然后对docx文件删除冗杂文字,然后再转回pdf。
【鶏啊鶏。】:我想把上方框选的两个信息直接删除(系统导出PDF自动生成出来的固定内容,日期取的是导出当天) 下方框选的内容细节部分1.【客户】及对应的文本值 删除 ; 2.【资质要求】中对应的文本值 替换成固定的值 如XXX。我试着去看看word的处理 谢谢老师的提示。
三、总结
大家好,我是Python进阶者。这篇文章主要盘点了一个Python正则表达式处理Excel数据的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。