首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >在没有文字和图像重叠的文档上找到最佳的邮票位置

在没有文字和图像重叠的文档上找到最佳的邮票位置
EN

Stack Overflow用户
提问于 2012-12-08 11:58:07
回答 2查看 482关注 0票数 0

我想algoritm应该由以下词干组成(示例位于底部):

  1. 信息区域检测(文字、图像)。
  2. 找出最接近顶部位置的邮票张贴,而不与元素区域重叠,这已经被检测到在第一步(这一步骤可以实现蒙特卡罗方法)。

此外,我对文本和图像区域检测也有以下想法:

  1. 使用tesseract或其他OCR。这种方法的缺点是有些页面元素不能被检测(行、图片等)。此外,文本识别是此任务的开销。
  2. 使用OpenCV或其他计算机视觉库(但我不知道具体方法)。

是否有人可以建议更好的方法,谈判或图书馆,以获得最好的印章位置的文件。

EN

回答 2

Stack Overflow用户

发布于 2012-12-12 19:35:26

假设你知道邮票的大小,我会提出一个天真而有力的解决方案。

假设文档是1000*1000像素,邮票是200*100。为文档创建金字塔(例如,将4个金字塔的样本降至500*500、250*250、125*125、67*67)。对于最小的金字塔(比原始图像小16倍),当你找到这样的位置时,搜索一个12*6大小的空矩形,然后在金字塔上检查它是否正常。

这并不是最有效的解决方案,但由于金字塔的存在,它会运行得很快。

我认为OCR对这类问题来说是个过分的问题。

票数 2
EN

Stack Overflow用户

发布于 2012-12-13 07:51:40

你不需要也不想要OCR。

假设原始图像中的白色像素值为0,黑色像素值为1,灰色阴影具有中间值(如果情况不是这样,则只需重新确定和/或否定图像),“理想”解决方案是:

  • 集最佳=无穷大
  • 对于邮票图像的每个可能的左上角位置(x,y):
    • 集合s=0
    • 对于邮票中的每个非白色(或“不透明”)像素(i,j):
      • S += PagePixel(x+i,y+j) (或像素值的其他函数,见下文)

代码语言:javascript
运行
复制
- If s is lower than best, we have found a better placement:  
    - Set best to s, bestX to x and bestY to y

之后,(bestX,bestY)将是覆盖暗像素的最低总“权重”的邮票的位置。您可能更喜欢使用平方像素值,或其他一些功能,以给予更多的重要性,以避免非常暗像素。

因为上面的过程所需的时间与页面中像素数乘以邮票中的非白色像素数成正比,所以速度可能很慢(在任何现代CPU上,它仍然只需要一秒的时间)。在这种情况下,按照OopsUser的建议,对这两个图像进行子采样是有意义的。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/13777238

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档