首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Tesseract OCR音高文本

Tesseract OCR音高文本
EN

Stack Overflow用户
提问于 2020-03-18 04:31:22
回答 1查看 188关注 0票数 0

当涉及到光学字符识别软件,特别是Tesseract OCR引擎时,我有一个关于术语的问题。

我正在读一篇关于Tesseract OCR引擎的文章,它经常提到一些叫做Fixed pitch text的东西,我不完全确定这意味着什么。我假设音高是一行文字占据的空间,但在我正在阅读的文章的上下文中,这是没有意义的。

这是该条中使用这一措辞的一句话:

小块被组织成文本行,并对固定音高或比例文本的线条和区域进行分析。

我已经在网上查找过这方面的一些定义,但是大多数关于OCR的文章都是在没有解释的情况下使用的。我猜这意味着这是一个相当简单的/常见的术语。

如果有人关心的话,我正在读的这篇文章叫做“Tesseract OCR引擎概述”,作者是Ray。

EN

回答 1

Stack Overflow用户

发布于 2020-03-18 04:38:09

当第一次尝试在图像中查找文本时,Tesseract将识别文本中存在气泡的可能区域。一旦可能出现文本的区域被识别出来,Tesseract就会寻找这些区域是否包含“固定音高”。基本上,这意味着它试图找出它之前发现的区域是否包含文本。固定的音高是用来创建某个字母或单词的不同类型的向量,Tesseract寻找那些在图像中分析它所看到的字母或单词的人。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60733576

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档