我在Python中合并了许多PDF文件,并得到了错误“errno 2 nno such file or directory”,尽管该文件是存在的。
我试图显示PDF文件,只是为了显示PDF文件的存在。
import os
from PyPDF2 import PdfFileMerger
merger = PdfFileMerger()
source_dir = os.getcwd() + '/Combined PDF'
for items in os.listdir(source_dir):
if items.endswith('.pdf'):
我只是想用python合并一些PDF文件,更具体地说是PyPDF2。很简单,但由于某些原因,我得到了一个错误,这是根本不理解的。
在寻找解决方案的过程中,我发现其他人也有这个问题。然而,我没有满意的解决方案张贴出来。
我的合并文件代码:
from PyPDF2 import PdfFileMerger
def merge(self, work_files, destination_file):
pdf_merger = PdfFileMerger()
for pdf in work_files:
pdf_merger.append(pdf)
我一直在创建一个使用PyPdf2合并多个pdf文件的Python程序.
这是代码
import os
from PyPDF2 import PdfFileMerger
source_dir = os.getcwd()
merger = PdfFileMerger()
for item in os.listdir(source_dir):
if item.endswith('pdf'):
merger.append(item)
merger.write('completed_file.pdf')
merger.close()
在运行
我想把一个给定的PDF的页面分割成单独的PDF。
下面是我写的代码,但在这里,当使用open()和.write()函数保存文件时,我得到了错误: AssertionError
from PyPDF2 import PdfFileReader, PdfFileWriter
pdf = PdfFileReader("input.pdf") # this is the source pdf
for page in range(pdf.getNumPages()):
pdf_writer = PdfFileWriter()
pdf_writer.addPage(p
我使用Python3,使用,为了将页码添加到新生成的PDF (我使用)中,我按以下方式逐页合并两个PDF文件:
from PyPDF2 import PdfFileWriter, PdfFileReader
def merge_pdf_files(first_pdf_fp, second_pdf_fp, target_fp):
"""
Merges two PDF files into a target final PDF file.
Args:
first_pdf_fp: the first PDF file path.
代码是
from PyPDF2 import PdfFileReader
with open('HTTP_Book.pdf','rb') as file:
pdf=PdfFileReader(file)
pagedd=pdf.getPage(0)
print(pagedd.extractText())
此代码引发下面所示的错误:
TypeError: ord() expected string of length 1, but int found
我在网上搜索,发现了这个,但没有多大帮助。我知道这个错误的背景是什么,但不确定它在这里有什么
我正在尝试制作一个python程序,它循环遍历文件夹中的所有文件,选择那些扩展名为'.pdf‘的文件,并使用受限权限对它们进行加密。我使用的是这个版本的PyPDF2库:https://github.com/vchatterji/PyPDF2。(对原始PyPDF2的修改也允许设置权限)。我已经用一个pdf文件测试了它,它工作得很好。我希望原始的pdf文件应该被删除,加密的文件应该保留相同的名称。下面是我的代码: import os
import PyPDF2
directory = './'
for filename in os.listdir(directory)
我一直在用Python创建一个程序,将2个pdf文件合并到一个文件中。这是代码:-
import os
from PyPDF2 import PdfFileMerger
source_dir = os.getcwd()
merger = PdfFileMerger()
for item in os.listdir(source_dir):
if item.endswith('pdf'):
merger.append(item)
merger.write('completed_file.pdf')
merger.close()
在运
首先,我使用的是Python3.5.1 (32位版本),我编写了以下程序,使用PyPDF2和reportlab在我的pdf文件的所有页面上添加页码:
#import modules
from os import listdir
from PyPDF2 import PdfFileWriter, PdfFileReader
import io
from reportlab.pdfgen import canvas
from reportlab.lib.pagesizes import A4
#initial values of variable declarations
PDFlist=[]
X
我使用Python 3.6.5将PDF合并在一起,但遇到了一个问题。下面的代码引发一个'TypeError: 'NumberObject' object is not subscriptable'错误。我做错了什么?当我用merger.append注释掉这一行时,它会正确地打印出文件路径。
import webbrowser
import os
from PyPDF2 import PdfFileMerger, PdfFileReader
path = 'C:/test/pdfs'
merger = PdfFileMerger()
for pd
我正在尝试将pdf分成多个页面,并将每个页面另存为一个新的pdf。我尝试了上一个问题中的方法,但没有成功,也尝试了中的pypdf2拆分示例,但没有成功。编辑:我可以在我的文件中看到它成功地写入了第一页,然后创建了第二页pdf,但它是空的。
下面是我尝试运行的代码:
from PyPDF2 import PdfFileWriter, PdfFileReader
inputpdf = PdfFileReader(open("my_pdf.pdf", "rb"))
for i in range(inputpdf.numPages):
output = Pd
我有问题,需要你的帮助。我通过“用Python自动完成无聊的事情”来学习Python。我目前在第13章,处理PDF文件和Word文件。我有这些代码从book.It基本上合并的pdf文件,没有他们的第一页。但是在运行程序之后,我没有看到任何PDF文件弹出。我试图在目录中找到它,但它也不在那里。所以帮我找到那份文件谢谢!这是密码
import PyPDF2
import os
pdfFiles = []
for filename in os.listdir('.'):
if filename.endswith('.pdf'):
pdfFiles.append
当我尝试读取PDF文件时,出现以下错误。
代码:
from PyPDF2 import PdfFileReader
import os
os.chdir("Path to dir")
pdf_document = 'sample.pdf'
pdf = PdfFileReader(pdf_document,'rb') #Error here
错误:
Traceback (most recent call last):
File "/home/krishna/PycharmProjects/sample/sample.py", l
我为这个问题搜索了很多次,但我没有找到这个问题的确切解决方案,这就是为什么我要问这个问题……
这是我使用PyPDF2在python中合并两个pdf文件的代码:
import os
from PyPDF2 import PdfFileReader, PdfFileMerger
files_dir = "/Users/ajayvictor/"
pdf_files = [f for f in os.listdir(files_dir) if f.endswith("pdf")]
merger = PdfFileMerger()
for filename in pd
我正在尝试使用PyPDF2中的PdfFileMerger()来合并pdf文件(参见代码)。
from PyPDF2 import PdfFileMerger, PdfFileReader
[...]
merger = PdfFileMerger()
if (some condition):
merger.append(PdfFileReader(file(filename1, 'rb')))
merger.append(PdfFileReader(file(filename2, 'rb')))
if (test for non-zero f
我正在尝试使用Python将几个PDF文件组合成一个PDF文件。我已经尝试了PyPDF和PyPDF2 -在一些文件上,它们都抛出了这个相同的错误:
PdfReadError:找不到EOF标记
以下是我的代码(page_files)是要组合的PDF文件路径列表:
# use pypdf to combine pdf pages
output = PdfFileWriter()
for pf in page_files:
filestream = file(pf, "rb")
pdf = PdfFileReader(filestream)
我正面临着从pdfkit.from_file(文件名,'w+')生成的pdf文件的问题。其中filename是html文件。 从html文件生成PDF文件后,将使用以下代码合并: merger = PdfFileMerger()
for pdf in input_files: merger.append(pdf)
merger.write(output_stream) merger.close() 这就是我遇到错误的地方: File "/home/finrpt/finrpt/finrpt_py/htm_gen.py", line 193, in pdf
我有成千上万的PDF文件,像。
我正在尝试使用PyPDF2将它们转换为纯文本(代码如下)。但PyPDF2显然只“看到”水印,而不是内容本身。我能在这里做些什么?
import os
import PyPDF2
path_to_pdfs = '/path/to/pdf/files/'
for filename in os.listdir(path_to_pdfs):
if '.pdf' in filename.lower():
with open(path_to_pdfs + filename, mode = 'rb')
这是我的第一个python代码。作者传递了一个错误。这似乎是随机发生在循环过程中,通过pdf的。
try: except: pass将无法工作,因为它只会跳过该问题的文件,而不会为它生成一个输出。
strict=False似乎不适合作者。
错误:
PdfReadWarning: Multiple definitions in dictionary at byte 0x6eb54 for key /PageMode [generic.py:587]
PdfReadWarning: Multiple definitions in dictionary at byte 0x75740 for key
我有一个大小的问题,当我合并一个PDF使用PyPDF2。我有以下代码来合并pdfs文件: merger = PyPDF2.PdfFileMerger()
for pdf in fileSorted:
merger.append(pdf[1])
os.remove(pdf[1])
merger.write(tmpPath + '/result.pdf') 问题是,PDF的大小比原始的太高了。如何指定pdf大小? 输入文件的大小为210*297 of (A4),输出的大小为900x1273 of 非常感谢
首先,我对使用Python和PyPDF非常陌生。我试图收集所有的字段在一个pdf收集成一个数据。最后,我想收集成千上万的PDF,它们都具有与基线相同的结构(表单),并将它们放入PDF中。在没有数字证书/签名的情况下,我能够让这些代码在PDF上工作得很好。但是,当我在PDF上运行带有数字证书/签名的代码时,会出现错误。
我真的不需要文档的数字签名/证书点,所以我认为最简单的方法就是跳过PDF字段。但是,我不知道如何做到这一点,因为PyPDF2包会查看每个字段。
代码:
import os
import PyPDF2 as pypdf
import pandas as pd
directory
我看了一个视频,学习如何将PDF文件合并为一个PDF文件。我尝试在代码中进行一些修改,以便处理包含PDF文件的文件夹,主文件夹(Spyder)包含Demo.py,这是代码 import os
from PyPDF2 import PdfFileMerger
source_dir = os.getcwd() + './PDF Files'
merger = PdfFileMerger()
for item in os.listdir(source_dir):
if item.endswith('pdf'):
merger.append
我使用PyPDF2读取多个pdf文件。我的脚本如下:
from PyPDF2 import PdfFileReader
flist = os.listdir(pdfFolder)
for f in flist:
pdfFileObj = open(os.path.join(pdfFolder, f), 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj, strict=False)
for i in range(0,pdfReader.numPages):
pageObj = pdfReader
使用Python,是否可以将pdf页面裁剪到下图所示的内容中,其中任务是在Inkscape中实现的?内容的边界区域应该是自动找到的。
使用PyPDF2我可以裁剪页面,但它需要手动查找坐标,这对于大量文件来说是乏味的。在Inkscape中,坐标是自动找到的。
我使用的代码如下所示,示例输入文件是。
# Python 3.7.0
import PyPDF2 # version 1.26.0
with open('document-1.pdf','rb') as fin:
pdf = PyPDF2.PdfFileReader(fin)
pa