快速的帮助是非常感谢的。我正在通过tesseract-OCR从tiff图像中提取文本。我正在寻找is.HOCR (HTML)的输出。在内容方面,我得到了完美的输出,但是格式看起来非常混乱。但同样,当我打开记事本++时,它给出了一种清晰的格式。
下面给出了windows命令行
Tesseract "Path\image.tiff" "Path\output" HOCR
需要您的帮助,以获得有组织的hocr格式的记事本作为附件。
我是如何组织起来的?
当我用记事本打开数据时?
https://stackoverflow.com/questions/71046353
复制相似问题