我正在使用ImageMagick转换一个数字化的PDF文件到tiff。我使用Tesseract扫描文档的一小部分,这是一个数字。我的数字化文档的清晰度很差,有时tesseract无法读取正确的数字。例如,它写着: 5550002845表示您可以在图片中看到的数字。
此图片是使用以下命令从PDF中提取的:
convert -quality 100 -density 300 temp.pdf -depth 8 -colorspace gray +matte +contrast +contrast temp.tiff
有什么更好的方法可以提高( Tesseract检测的)图像质量吗?
问候
发布于 2013-12-20 17:48:26
-noise 7做到了这一点
https://stackoverflow.com/questions/20700128
复制相似问题