我想algoritm应该由以下词干组成(示例位于底部):
此外,我对文本和图像区域检测也有以下想法:
是否有人可以建议更好的方法,谈判或图书馆,以获得最好的印章位置的文件。
发布于 2012-12-12 19:35:26
假设你知道邮票的大小,我会提出一个天真而有力的解决方案。
假设文档是1000*1000像素,邮票是200*100。为文档创建金字塔(例如,将4个金字塔的样本降至500*500、250*250、125*125、67*67)。对于最小的金字塔(比原始图像小16倍),当你找到这样的位置时,搜索一个12*6大小的空矩形,然后在金字塔上检查它是否正常。
这并不是最有效的解决方案,但由于金字塔的存在,它会运行得很快。
我认为OCR对这类问题来说是个过分的问题。
发布于 2012-12-13 07:51:40
你不需要也不想要OCR。
假设原始图像中的白色像素值为0,黑色像素值为1,灰色阴影具有中间值(如果情况不是这样,则只需重新确定和/或否定图像),“理想”解决方案是:
- If s is lower than best, we have found a better placement:
- Set best to s, bestX to x and bestY to y
之后,(bestX,bestY)将是覆盖暗像素的最低总“权重”的邮票的位置。您可能更喜欢使用平方像素值,或其他一些功能,以给予更多的重要性,以避免非常暗像素。
因为上面的过程所需的时间与页面中像素数乘以邮票中的非白色像素数成正比,所以速度可能很慢(在任何现代CPU上,它仍然只需要一秒的时间)。在这种情况下,按照OopsUser的建议,对这两个图像进行子采样是有意义的。
https://stackoverflow.com/questions/13777238
复制相似问题