首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Windows Tesseract OCR得到分散的HOCR输出,而不是干净的标准格式

Windows Tesseract OCR得到分散的HOCR输出,而不是干净的标准格式
EN

Stack Overflow用户
提问于 2022-02-09 08:40:34
回答 1查看 266关注 0票数 0

快速的帮助是非常感谢的。我正在通过tesseract-OCR从tiff图像中提取文本。我正在寻找is.HOCR (HTML)的输出。在内容方面,我得到了完美的输出,但是格式看起来非常混乱。但同样,当我打开记事本++时,它给出了一种清晰的格式。

下面给出了windows命令行

代码语言:javascript
运行
复制
Tesseract "Path\image.tiff" "Path\output" HOCR

需要您的帮助,以获得有组织的hocr格式的记事本作为附件。

我是如何组织起来的?

当我用记事本打开数据时?

EN

回答 1

Stack Overflow用户

发布于 2022-02-09 12:24:43

问题不在于,而在于记事本。使用一些普通的文本编辑器,如notepad++上下文

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71046353

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档