因此,我可以选择从数据库发送文档以PDF或XPS格式打印。我需要能够提取特定的数据,如姓名,日期等从这些格式之一,并将该数据插入到word模板。word模板不可编辑。您只能在字段中键入...每个字段前面都有一个标题,如姓名、道布等。
基本上,我需要能够自动将该信息从PDF或XPS文件转移到word模板。
我对C++、Python和Java已经很熟悉了。所以我没有语言偏好--只要能完成工作就行。
你能建议一种我可以设法完成这件事的方法吗?我有一点困难,找不出从这些文件类型中解析/提取数据的方法,以及哪种文件类型会更好。我完全不知道如何在Word模板中自动填充字段。
哦,忘了提一下,这是在Windows7(也许是8,但大部分是7)机器上。
提前感谢您的帮助!
发布于 2013-08-13 09:42:13
这是为那些有同样问题的人准备的,所以我是这样做的:
我使用PDFBox (http://pdfbox.apache.org/)解析文档并提取所需的数据,然后使用docx4j (http://www.docx4java.org/trac/docx4j)将数据插入word模板。这两个都是令人难以置信的工具,并且都有优秀的社区,几乎可以立即提供帮助。
https://stackoverflow.com/questions/17460349
复制相似问题