首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何将pdf文件从灰度转换为黑白?

如何将pdf文件从灰度转换为黑白?
EN

Unix & Linux用户
提问于 2013-07-28 12:35:32
回答 1查看 15.2K关注 0票数 13

我的操作系统是Ubuntu12.04。如何将pdf文件从灰度转换为黑白?灰度pdf文件来自于带有灰度选项的扫描,并且OCR需要黑白等级pdf。

更新:

根据Marco的答复,B pdf不是很好,原始文件是这里

EN

回答 1

Unix & Linux用户

发布于 2018-02-03 19:32:23

最好的方法,我发现,没有质量损失,消除阴影,噪音,文字从下一页流血等:

  1. 首先将pdf转换成单个图像pdfimages combined_ocr.pdf page
  2. 第二,去除阴影,噪音,文本从下一页流血通过(信用到这个博客 ) ls ./p*.ppm | xargs -L1 -I {} convert {} -quality 100 -density 300 -fill white -fuzz 80% +opaque "#000000" {}.jpg

这可以作为额外的步骤添加,也可以代替上面的命令来实际获得两种颜色:

代码语言:javascript
运行
复制
ls ./p*.ppm | xargs -L1 -I {} convert {} +dither -colors 2 -type bilevel -density 300 -fill white -fuzz 40% +opaque "#000000" -density 300 {}.jpg

50-60%的fuzz没有那么激进,结果更加可读性:

代码语言:javascript
运行
复制
ls ./p*.ppm | xargs -L1 -I {} convert {} +dither -colors 2 -type bilevel -density 300 -fill white -fuzz 40% +opaque "#000000" -density 300 {}.jpg
  1. 这将在不丢失分辨率或质量的情况下,从每个jpg图像中生成一个pdf文件:ls -1 ./*jpg | xargs -L1 -I {} img2pdf {} -o {}.pdf
  2. 这是为了将pdfpage连接成一个:pdftk *.pdf cat output combined.pdf
  3. 最后,我添加了一个OCRed文本层,它不会改变pdfs中扫描的质量,因此它们可以搜索:pypdfocr combined.pdf
票数 5
EN
页面原文内容由Unix & Linux提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://unix.stackexchange.com/questions/84709

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档