我有一组非常小的图片(w:70-100;h:12-20),如下所示:
在这些图片中,除了组成员的昵称外,什么都没有。我想从简单的图片中阅读课文,它们都有一个背景,只是昵称不同。所以,我对这张照片所做的是:
我正在使用下面的代码从第二个图像中获取文本:
tesseract::TessBaseAPI ocr;
ocr.Init(NULL, "eng");
PIX* pix = pixRead("D:\\image.png");
ocr.SetImage(pix);
std::string result = ocr.GetUTF8Text();
我有两个问题:
ocr.GetUTF8Text();
运行缓慢:650-750毫秒。图像很小,为什么它能工作这么久?如何处理图像/代码,或者如何阅读(以及在何处)阅读tesseract-ocr (关于文本速度和质量识别的内容)来解决这些问题?
发布于 2016-07-02 06:25:43
这听起来可能很奇怪,但当我增加图像的尺寸时,我总是有最好的运气。这张照片在我看来会“更糟”,但它的速度更快,精确度也更高。
然而,在你开始获得更糟糕的结果之前,你能拍出多大的图像是有限度的:)我记得我以前拍过600 in的照片。不过,你还是得玩了。
https://stackoverflow.com/questions/38156961
复制相似问题