我想压缩扫描的文本(单色或几种颜色),并将其存储在pdf (可能是djvu)文件中。我记得我用Windows/Acrobat和"ZRLE“压缩的单色tiff嵌入到pdf中得到了非常好的结果。据我所知,这个算法是不松散的。现在我在寻找一种在linux上获得好结果的方法。它应该节省存储空间并避免丢失(我不介意丢失颜色,但我不想要jpeg压缩,这会对文本扫描产生嘈杂的结果)。我需要它来进行批量转换,所以我考虑使用ImageMagick convert命令。但是,我应该使用哪种输出格式才能获得好的结果,并能够将其嵌入到pdf文件中(例如,使用pdflatex)?或者通常使用djvu文件更好?
发布于 2011-12-05 06:17:24
使用jbig2压缩的图像的jbig2enc编码器,最初是由Adam Langley为GoogleBooks编写的
https://github.com/agl/jbig2enc
我加入了Rubypdf和其他人的最新改进。
https://github.com/DingoDog/jbig2enc
我还为puppy 构建了几个jbig2enc的二进制文件(它也可以在其他发行版上运行)
http://dokupuppylinux.info/programs:encoders
发布于 2011-12-02 23:37:06
DJVU不是一个糟糕的选择,但如果你想留在PDF中以获得更好的兼容性,你可能会想看看lossless JBIG2压缩。
引用维基百科的话:
总的来说,JBIG2用于压缩文本的算法与DjVu文件格式中用于编码二进制图像的JB2压缩方案非常相似。
https://stackoverflow.com/questions/8358284
复制相似问题