我创建包含文本、图像和现有pdfs的pdfs。通过将现有pdfs合并到pdf中来添加现有pdfs。问题是,如果首先添加一个pdf,然后添加图像,则iText.Layout.Document不考虑合并的pdf所占用的空间,而是将图像添加到“文档标题”段落后面(参见示例)。这会产生无序的图像,有时甚至是图像和合并pdfs的重叠。我需要正确的秩序和没有重叠,我如何解决这个问题?= new
我要从多个PDF文件中提取文本。PDF文件包括文本和一些图像,甚至一些页面是扫描的页面(我假设扫描的页面就像图像)。我按照下面的命令从PDF文件中提取文本。我的问题是,如何使用条件编辑命令,以检查每个页面是否包含任何图像,然后从图像中提取文本。如果你能帮助我,我将不胜感激。for foldername,subfolders,files in os.walk(r"C:/MY PATH"):