截图上的tesseract OCR给出了相当不稳定的结果。即使图像完全是黑色的,上面覆盖着白色文本,似乎也只有部分文本被正确识别。即使在我将图像调整为300dpi之后,准确率仍然很低,并且大多数文本都是胡言乱语。 我在StackOverflow上看到了类似的问题:Best way to recognize characters in screenshot? 如前所述,问题的作者能够通过用他的字体训练tesseract引擎来获得几乎100%的准确率。 我的图像中的字体是Arial。我怎样才能提高准确率呢? 这是我拥有的一种图片的示例:Image Sample
Google能够识别经常出错的十六进制数字(准确率约为60%)。例如,当我试图识别带有“78303D 61”的扫描图像时,Google会识别它的文本,比如“78303061”。对于OCR识别,我使用了和.NET Api客户端,结果也不正确。
以下是我的C#代码:
var image = await Google.Cloud.Vision.V1.Image.FromFileAsync("c:\\path\\to\\file.png");
var imageContext = new ImageContext();
imageContext.LanguageHints.Add(
我正在尝试使用android ML Kit文本识别库进行文本识别,但在运行时遇到错误,没有返回任何文本。错误: W/TextNativeHandle: Native handle not yet available. Reverting to no-op handle.
W/DynamiteModule: Local module descriptor class for com.google.android.gms.vision.dynamite.ocr not found.
I/DynamiteModule: Considering local module com.google.and