文章/答案/技术大牛

发布

社区首页 >问答首页 >Windows Tesseract OCR得到分散的HOCR输出，而不是干净的标准格式

问Windows Tesseract OCR得到分散的HOCR输出，而不是干净的标准格式
EN

Stack Overflow用户

提问于 2022-02-09 08:40:34

回答 1查看 266关注 0票数 0

快速的帮助是非常感谢的。我正在通过tesseract-OCR从tiff图像中提取文本。我正在寻找is.HOCR (HTML)的输出。在内容方面，我得到了完美的输出，但是格式看起来非常混乱。但同样，当我打开记事本++时，它给出了一种清晰的格式。

下面给出了windows命令行

Tesseract "Path\image.tiff" "Path\output" HOCR

需要您的帮助，以获得有组织的hocr格式的记事本作为附件。

我是如何组织起来的？

当我用记事本打开数据时？

windows

command-line

ocr

tesseract

hocr

回答 1

Stack Overflow用户

发布于 2022-02-09 12:24:43

问题不在于，而在于记事本。使用一些普通的文本编辑器，如notepad++或上下文。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/71046353

复制

相似问题

问Windows Tesseract OCR得到分散的HOCR输出，而不是干净的标准格式
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Windows Tesseract OCR得到分散的HOCR输出，而不是干净的标准格式EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Windows Tesseract OCR得到分散的HOCR输出，而不是干净的标准格式
EN