首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >免费的PDF操作库或代码?

免费的PDF操作库或代码?
EN

Stack Overflow用户
提问于 2012-10-13 19:57:29
回答 2查看 4K关注 0票数 1

我想开发一个用于商业用途的工具(我打算出售它),其中将包括操作文档文件。

操作将包括: 1。将多个PDF文件连接成一个文件。2.将doc/docx文件转换为PDF文件。3.将单个PDF文件分解为2个独立的PDF文件。4.对PDF文件的页面进行编号(按顺序编号)。

为此,我正在寻找一个免费的库或代码来帮助我处理PDF操作。我更喜欢库在C#中,因为我的软件将在C#中,因为它有一些图形用户界面,但我也会使用Java库进行管理……

我找到了"pdftk“库,这对我有很大帮助,但不幸的是,它的许可证不允许商业使用……

有没有人有一个免费的库或代码,可以帮助我做到这一点?

非常感谢!

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2012-10-13 19:59:49

如果你想用java操作PDF,PDFBox是一个很好的选择。

你也可以看看支持java和C#的itextpdf。这个库有一个社区版本。

票数 1
EN

Stack Overflow用户

发布于 2012-10-13 21:19:02

看看http://www.foolabs.com/xpdf/download.html上的pdftotext吧。

它提供了将PDF文件的内容提取到文本文件中的选项。与其他库相比,它的突出之处在于它保留了提取的文本文件中PDF文件的格式。当您的PDF包含表等结构化数据,并且PDF文件未加标签时,此功能非常有用。PDFBox和其他库在解析时无法维护PDF内容的结构。

一旦您从PDF中提取出文本文件,您就可以自由地使用您最喜欢的编程语言来解析文本文件。

看看这里的许可政策:http://www.glyphandcog.com/Xpdf.html。它清楚地指出,如果您直接使用可执行文件而不修改源代码,您可以自由地重新分发使用可执行文件的应用程序。如果性能不是问题,你就不需要接触他们的源代码。

如果性能是个问题,您可以创建一个试用版的应用程序,它突出显示了功能,但速度自然很慢,因为每次您想要处理PDF时,它都会运行可执行文件。付费版可以直接调用pdftotext接口,速度更快。你可以很容易地弥补花在许可上的钱。如果我是你,我会这么做,但我现在已经有一些大项目要做了:)

我可以担保pdftotext,因为我自己也用过它。所有其他库似乎都忘记了,用户可能会对保持PDF文件的格式感兴趣。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/12872878

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档