我有一个非常具体的场景文本检测和解析问题。我甚至不确定你是否能说这是一个真实的场景文本。
我从一张身份证照片中提取了一个姓名字段:
我可以立即开始在图像上应用一些OCR,但我相信还可以应用进一步的文本本地化。为了实现这一形象:
你知道任何这样的文本本地化算法吗?我已经试过“FASText by Busta”、“EAST by argman”,他们工作得很得体。有关于这个特定任务的算法吗?
在文本本地化之后,我认为现在是应用OCR的最佳时机。现在我感到迷茫了。您推荐使用哪一种?我已经试过“Tesseract”了,但效果不太好。使用Tensorflow为文档字符制作自己的OCR是否更好?
我使用Google Cloud Vision Python API来执行OCR,以便从文档中提取信息,比如身份证明。有没有一种方法可以裁剪图像,只保留集中文本的部分?我尝试使用cropHint,但它简单地消除了边界。
我的代码中的函数有点类似于:
def detect_text(path):
"""Detects text in the file."""
vision_client = vision.Client()
with io.open(path, 'rb') as image_file:
我正在使用tessnet2 (tesseract-ocr)在C#中处理以下图像:
这是我的密码:
var image = new Bitmap(@"D:\anuj\a2.jpg");
ocr.Init(@"D:\anuj\OCRTest\tessdata", "eng", false);
var result = ocr.DoOCR(image, Rectangle.Empty);
foreach (Word word in result)
Console.Write("{0} ", word.Text);