我整理了很多PDF文件(其中大部分是学术论文),并正在寻找一个能够自动检测和提取标题、作者和参考的软件。有这样的软件或库吗?
发布于 2016-09-10 07:04:26
门德利是专门为您所做的此类工作而设计的&桌面客户端。
发布于 2016-09-16 14:52:38
发布于 2016-09-10 06:19:31
如果标题、作者、引用包含指示它们是什么的任何字符串,则可以使用pdf2text库,它只从PDF文件中提取所有字符串。
https://softwarerecs.stackexchange.com/questions/36053
复制相似问题