我想用Tesseract来识别代码。他们的网站上说,我可以通过将配置变量load_system_dawg和load_freq_dawg设置为false来禁用字典。
然而,我一直未能正确地做到这一点。
$ tesseract img.jpg output.txt --oem 0 -c load_system_dawg=0 load_freq_dawg=0
read_params_file: Can't open load_freq_dawg=0
Error: Tesseract (legacy) engine requested, but components are not prese
我正在寻找Java中的OCR (光学字符识别)的示例代码或API名称,使用它我可以从图像文件中提取所有文本。没有比较它与任何图像,我正在做使用下面的代码。
public class OCRTest {
static String STR = "";
public static void main(String[] args) {
OCR l = new OCR(0.70f);
l.loadFontsDirectory(OCRTest.class, new File("fonts"));
l.lo