使用pdfbox将拆分的pdf文档保存到远程apache服务器

、

我使用Apache Tika和Go从任何类型的文件(.txt，.docx，.pdf等)中提取内容，代码如下。 if err !所以我想在这里做的是，我想把文件分块传递给Apache Tika server，这样它就可以分块提取内容。

浏览 14提问于2021-01-07得票数 0

1回答

、

我正在从远程服务器读取pdf文件，使用pdfbox拆分，并能够将拆分的文件保存在本地系统中，但无法将拆分的文件保存到远程服务器。我如何使用pdfbox做到这一点。下面是在本地系统中拆分和保存拆分文件的代码 String ur

浏览 20提问于2017-01-13得票数 0

1回答

如何使用Apache PDFBox拆分PDF？

、、

我正在使用Apache来处理我的PDFBox应用程序中的文件。例如，我想在每一页上拆分一个PDF文档。 wirth Apache PDFBox有可能做到这一点吗？如果是这样的话，是怎么做的？

浏览 0提问于2015-08-28得票数 3

回答已采纳

1回答

适当的Java堆大小

、

在尝试合并多个PDF文档时，我遇到以下错误...at org.apache.pdfbox.cos.COSStream.clone(COSStream.java:78) // Build a string for <em

浏览 2提问于2015-07-23得票数 0

1回答

不安装Tesseract的Apache Tika OCR

、、、

我正在使用将PDF文件解析为文本。一些PDF文件可以包含扫描文档。Apache使用Tesseract将文本识别为图像。但是没有带有Tesseract的jar库，用户应该在操作系统中安装Tesseract作为独立的应用程序。如果不安装Tesseract，我如何使用Apache中的Tesseract？:428) at org.apache.t

浏览 5提问于2017-09-16得票数 6

2回答

将简历上传到pdf文件中并在asp.net中显示

、、

我想知道如何上传一份简历在一个pdf文件在一个asp.net页面。我知道如何上传一个简单的txt文件，以及当字段被"，“分隔开时。这是我的密码。现在，我完全不知道如何做到这一点，在一个pdf文件包含一份简历。怎么做？请解释一下你的答案，我只是system.io的新手。再次感谢。

浏览 0提问于2013-09-02得票数 0

回答已采纳

3回答

将pdf拆分为不同的pdf页面

、

我尝试使用下面的库导入com.itextpdf，以便|：从一个pdf文档中每页创建一个新的pdf文档。例如，对于3页的a.pdf，我创建了1.pdf、a2.pdf和3.pdf，其中a1是第一页，等等……public static void o

浏览 2提问于2011-04-13得票数 0

3回答

PDFBox:拆分pdf和输出前缀

、、、、

我喜欢使用PDFBox从一个大的PDF文件中提取一个页面。我所有的“真正的”PDF文件都位于一个目录下。因此，如果我提取一个页面，我喜欢将该页面保存到单个页面的不同目录中)。(或通过管道将其标准输出)带有选项PDFSplit seams的PDFBox可以将拆

浏览 3提问于2012-12-10得票数 0

回答已采纳

4回答

创建pdf并与pdfbox合并

、、、

这就是我想要做的： import org.apache.pdfbox.pdmodel.PDDocument; import

浏览 12提问于2012-12-10得票数 4

回答已采纳

2回答

如何在android中将多个pdf文件合并为单个

、、、、

如何从设备中读取多个 .pdf文件并将它们合并到Android中的单 .pdf文件中？

浏览 11提问于2021-06-15得票数 0

2回答

Apache pdfbox声称PDF文档是加密的(但事实并非如此！)-修复？

、

在我的程序中，我正在下载misc。最后，我想使用Apache pdfbox (v1.8.8)将这些文档合并成一个组合文档。出于某种奇怪的原因，PDFMergerUtility无法声明这些文件是加密的--但它们显然没有加密！我可以在Adobe Reader和其他PDF查看器中打开它们，没有任何问题，也不需要提供任何密码。Java异常和堆栈跟踪为： Feb 28, 2015 6:25:54 PM org.apac

浏览 0提问于2015-03-02得票数 2

1回答

"IOException: COSStream已关闭，无法读取“在添加PdfBox页面后试图保存

、、

目标是将pdf与PDDocument对象中加载的pdf合并。我不想使用mergeUtility of PdfBox，因为它意味着关闭PDDocument对象。我有很多数据要处理，我使用一个循环来处理它。加载和关闭PDDocument将花费太多的时间和资源(也许我错了，但它的感觉是这样的)。这是我的方法： /

浏览 2提问于2019-07-30得票数 2

回答已采纳

1回答

PDFBox PDDocument添加一个pdf布局文档？

、、

我开始熟悉PDFBox的口味了。我想知道是否有一种方法可以将pdf布局元素放到PDDocument对象中。pdf-布局元素使用文档作为父元素，PDFBox使用PDDocument作为父元素。new Paragraph();//Im looking for something like doc.add(shape); 使用<em

浏览 0提问于2017-08-29得票数 2

2回答

Apache PDFBox -无法解密PDF

、

我在用Apache PdfBox (v1.8.2) lib解密PDF文档时遇到了问题。加密工作，但使用相同密码的解密会引发异常。(Java 1.6)import org.apache.pdfbox.pdmodel.encryption.AccessPermission; import or

浏览 3提问于2014-10-10得票数 0

回答已采纳

1回答

pdfbox生成带有西里尔字母的pdf

、

我使用pdfbox - 2.0.6创建pdf，导入自定义字体，并使用西里尔字符完成文档。当我在3台计算机(2台基于2xWindows，1台基于Linux ubunto )上测试时，一切正常。但是当我将我的代码部署到服务器(基于CentOS)时，代码抛出了这个异常：我试着用pdfbox的

浏览 0提问于2017-06-01得票数 2

2回答

PDFBox无法从PDF文件页生成图像

、、

我已经使用PDFBox将pdf文件分割成图像已有一段时间了，但是在更新到2.0.19之后，我开始遇到意外的异常。:191) at org.apache.pdfbox.rendering.PageDrawer.getPaint) at org.

浏览 10提问于2020-03-19得票数 0

回答已采纳

1回答

如何将PDFBox.jar集成到安卓项目中？

、、、

我知道这个问题已经问过好几次了，但是我不能解决我的问题。我正在使用pdfbox-1.8.7.jar。我的目的是读取PDF文档的内容并将其输出到控制台中。我将pdfbox-1.8.7.jar放入libs文件夹中。app/libs/pdfbox-1.8.7.jar。我能够将jar的内容导入到我的类中。import org.apache</e

浏览 4提问于2015-02-01得票数 2

1回答

使用PDFBOX拆分和合并pdf文件会生成大文件

、

我有这个pdf格式的大打印文件，它包含5544页，大小约为36mb。该文件由MS Word 2010创建，每个字母/文档上只包含文本和徽标。当我将所有的字母合并到一个新的pdf打印文件中时，仍然包含5544页，文件的大小增长到396mb。所有文本提取、拆分和合并都是通过从PHP调用Apache PDFBox命令行工具来执行的，但从控制台运行时结果是相同的。你知道如何减小

浏览 44提问于2017-07-12得票数 2

回答已采纳

1回答

使用JSR223 PostProcessor将提取的变量值保存在pdf文件中

、、

如何使用JSR223 PostProcessor在JMeter中将提取的变量值(文本/内容)保存在pdf文件中？假设变量名${data}。请提出一些解决办法。

浏览 4提问于2022-07-13得票数 0

1回答

在pdfbox* 2.00中将文档与PDFMergerUtility合并*

、、

Pdfbox合并文档与1.8.xx类似，如mergePdf.mergeDocuments() --它工作正常，.now pdfbox版本2.0.0包含一些参数，比如org.apache.pdfbox.multipdf.PDFMergerUtility.mergeDocuments(MemoryUsageSetting arg0) --什么是org.apache.pdfbox.multipdf.PDFMergerUtility.mergeDocuments(MemoryU

浏览 5提问于2016-03-10得票数 12

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

使用Apache Tika提取大文件