首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何将PDF转换成图片格式-Python

可能会有人问,很多PDF阅读软件都是可以直接将PDF文件保存成图片格式的,为什么非得用Python??

使用Python(代码)的优势就在于可以批量操作,试想,如果你有成百上千的PDF文件,你很有可能要一个一个的打开,然后用鼠标一步一步点另存为图片。而用Python,只用几行代码,就可以批量完成任务。

此外,刚刚遇到了另一种应用情景:

本人通过R软件生成了一个PDF文件,但是这个文件很大,200M+,使用电脑各种PDF阅读器无法打开,尝试使用Photoshop,等了很久之后依然没能打开。这种情况下,考虑使用代码将PDF转换成图片,因为使用代码不用打开文件,只需要对二进制数的处理,降低了对电脑配置的要求。

使用Python3的pdf2image模块:

1、安装前配置需求:

pip3和poppler

2、安装pdf3image:

pip3 install pdf2image

3、使用代码:

from pdf2image import convert_from_path

im = convert_from_path('./example.pdf')

im是一个list,每一页PDF都转化成了一个PIL图片对象

4、将PIL对象保存成图片

im[0].save("tt.png")#将第一页PDF保存成tt.png

原本一个无法通过PDF阅读器打开的PDF文件,在一两分钟内就保存成了一个可读的图片文件!

------------------------

参考资料:

https://github.com/Belval/pdf2image

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180303G14Q2F00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券