问从PDF中，从命令行(Linux)中提取带有页码的突出显示。
EN

Software Recommendation用户

提问于 2022-07-06 22:31:54

回答 1查看 290关注 0票数 3

有没有一种方法，从PDF中，从Linux上从命令行中提取带有相应页码的突出显示段落？我找到了两个工具，但它们并不完全符合我的需要：pdf-高光-提取器允许我提取带有页码的突出段落，但它没有命令行界面，只有图形界面。DyAnnotationExtractor有一个命令行界面，但只给我突出显示的段落，而不是页码。有什么工具能满足我的需要吗？

提前感谢您的帮助！

linux

pdf

回答 1

Software Recommendation用户

发布于 2022-11-15 12:33:18

我推荐使用漂亮的小Python库帕夫诺茨，它具有您正在寻找的功能。

$ pdfannots sample.pdf

如果与其他一些Bash命令相结合，它可以生成格式良好的输出。例如：

$ pdfannots sample.pdf --no-condense | \
# Removing duplicate lines:
cat -n | sort -uk2 | sort -nk1 | cut -f2- | \
# Improving output formatting:
awk '{$1=$1};1' | sed 's/^\(> \)//g' | sed 's/* Page #/\n&/'

票数 2

页面原文内容由Software Recommendation提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://softwarerecs.stackexchange.com/questions/83422

复制

相似问题

问从PDF中，从命令行(Linux)中提取带有页码的突出显示。
EN

回答 1

Software Recommendation用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从PDF中，从命令行(Linux)中提取带有页码的突出显示。EN

回答 1

Software Recommendation用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从PDF中，从命令行(Linux)中提取带有页码的突出显示。
EN