我正在使用OCR输出,并在其中搜索特殊的单词。
由于输出不干净,我根据低于特定阈值的字距查找与输入匹配的元素。然而,我认为Levenshtein距离或Hamming距离并不是最好的方法,因为OCR似乎总是犯同样的错误:I表示1,0表示O,Q表示O。例如,这些“经典”错误似乎不如"A for K“那么重要。是否有专门为OCR设计的字距算法,我可以使用它更适合我的情况?还是应该根据文字的视觉差异来实现我的自定义单词距离呢?
我正在尝试使用MODI在内存中已有的位图上执行OCR。我似乎找不到解决这个问题的方法,因为我找到的所有示例都使用create方法从磁盘中抓取图像并为OCR做准备。MODI.Document md = new MODI.Document();
//The Create method grabs the picture from disk snd prepares for OCRmd.Create("C:\\bmp.gif"); //but I don't want to r