图1:使用Python提取PDF文件基本信息
为了演示,我将从文件中随机提取一些页面,假设我只想获得第1-3、5、6和11-12页。...因此,我们可以构造一个列表来存储页码:[1,2,3,4,5,11,12]。
从PDF文件中获取页面
我们可以使用pdf.getPage()从pdf对象获取特定页面。...图2:使用Python从PDF文件中获取页面
创建并保存PDF文件
现在我们已经成功地从PDF中提取了一个页面。...之前,我们已经创建了要提取的页码列表:pages=[1,2,3,4,5,11,12]。由于Python基于0的索引,我们需要将每个数字移位1。只要把所有的数字循环一遍,然后从每个数字中减去一个。...过程和上文讲述的是一样的,所以不会在这里重复。提示:
1.循环遍历要合并的PDF文件。
2.在每个PDF文件中,遍历页面,并将每个页面添加到PdfielWriter对象中。