我正在做一个模块,在其中我需要采取图像->裁剪它->转换为文本。我已经做了,直到拍摄了一张照片,裁剪它,并在imageView中展示它。但我无法将imageView格式的图像转换为文本。protected void onActivityResult(int requestCode, int resultCode, Intent data) { //user is returning from capturing an image using the camera
我想知道YOLO (任何版本,特别是具有准确性的版本,而不是速度)是否可以对文本数据进行培训。我要做的是在文本图像中找到任何方程都存在的区域,。我问这个问题是因为:First of all I还没有找到用于文本数据的YOLO。第二,我们如何定制低分辨率不像(416,416),因为所有的图像要么是裁剪或水平主要以(W=2H)格式。请帮帮忙。任何一个Keras,Tensorflow或PyTorch都可以。
我目前正在研制一个小型OCR机器人。我几乎所有的事情都要做,现在我正在努力改进OCR。具体来说,它有两个问题:相同颜色梯度上的橙色/红色文本,以及由于某种原因,"1/1“的前1。如果有人知道如何使OCR更健壮,提高准确性和摆脱blob,我将感谢您的帮助。谢谢。# makes results more accurate - inspired from https://stackoverflow.com/questions/58103337/how-to-o