是否可以使用Tesseract OCR来OCR图片并识别图片中不同大小的字体。如果是,我需要使用任何其他第三方库还是可以使用纯Java。举个例子
我想用字体大小来检测报纸的标题和内容。
如能在此问题上提供任何帮助,将不胜感激。
发布于 2014-09-21 16:33:05
可以使用ResultIterator.WordFontAttributes API方法(使用Tess4J的Java示例)检索可识别文本的字体信息,包括字体名称和大小。
发布于 2016-02-15 17:30:10
Tesseract的hOCR输出包括行和字的边框,可以用来确定大小,也可以配置为通过打开hocr_font_info
配置变量在输出中包含字体的点大小。
https://stackoverflow.com/questions/25959396
复制相似问题