在图像格式中有满满的文字。(E)以图像文件*.tiff格式扫描的文件。光学字符识别方法只识别正常格式的字母表。在这种图像格式中包含的文字就像行文一样。那么如何识别中的文本并将其转换为文本文件呢?
发布于 2014-10-11 21:08:53
使用tesseract-ocr,你可以训练角色。如果您确定使用running letter字体,则可以使用这些样本作为训练数据,而不是使用随附的默认数据。我还没有完成运行letter,但是这个库是一个很好的起点。
http://code.google.com/p/tesseract-ocr/
问候你,普拉桑娜。
https://stackoverflow.com/questions/26314978
复制相似问题