我所要寻找的基本描述是可以从图像中提取文本(手工编写),并将其作为一个普通的字符流返回,而无需任何页面处理。
更多规格:

我自己的研究向我指出了以下软件/库:
我已经测试了Tesseract和ABBYY,他们提供的结果与我所期望的相差甚远: Tesseract给了我一个200+字符的输出,用于我附在这篇文章上的图片,而ABBYY没有提供任何字符,只是提供了一些行。
发布于 2019-08-22 15:42:44
OCR通常通过在白色背景下识别黑色文本字符来工作,所以大多数OCR方法都试图将图像“二值化”,并将其转换为黑白图像。
考虑到您正在使用的映像,这里有一些问题使得这很困难:
这些问题的结合导致没有文本被识别,因为文本不够突出,或者在OCR试图解释虚线和背景时检测到大量的假文本。
这意味着,对于这种类型的图像,需要进行一些图像处理,以使文本更适合OCR。
例如,对于这个特定的映像,我可以使用来自LEADTOOLS工具包的图像处理类来实现以下结果。(免责声明:我是该工具包供应商的雇员)

所使用的图像处理如下:
此代码如下所示:
HistogramEqualizeCommand histCommand = new HistogramEqualizeCommand();
histCommand.Run(image);
IntensityDetectCommand intensityDetectCommand = new IntensityDetectCommand();
intensityDetectCommand.LowThreshold = 5;
intensityDetectCommand.HighThreshold = 255;
intensityDetectCommand.Run(image);
MedianCommand medCommand = new MedianCommand();
medCommand.Dimension = 9;
medCommand.Run(image); 然后,通过使用工具箱中的OCR/ICR类,我能够识别文本:

要求ICR承认该案文。请注意,在该工具包的Java版本中没有此功能。
或者,如果不想执行图像处理,请考虑更改基本图像:
https://softwarerecs.stackexchange.com/questions/62495
复制相似问题