正如标题所指出的,我收集的大多数图像都有黑色的背景和浅色的文字,这使得tesseract很难识别嵌入的文本。有人知道我如何用TextCleaner交换两种颜色吗?谢谢!
发布于 2017-12-19 07:41:50
在我的文本清理器脚本中没有这方面的标志。但我会尝试添加一个。现在,您可以通过在脚本中输入-negate ImageMagick命令来完成此操作:
convert input -negate miff:- | textcleaner -f 20 -o 10 - output
编辑:我刚刚发布了脚本的另一个版本,以允许单向或双向反转。所以上面的例子是
textcleaner -f 20 -o 10 -i 1 input output
其中-i 1表示反转输入的颜色。如果您想反转颜色,然后处理,然后再次反转输出,然后使用-i 2。
请注意,如果您正在使用textcleaner用于商业用途,请与我联系有关许可的问题。
https://stackoverflow.com/questions/47877929
复制相似问题