我正在尝试提取放在拼字板上的瓷砖(字母)。目标是识别/阅读董事会上所有可能出现的单词。
一个例子-
理想情况下,我想找出拼字板的四个角落,并应用透视变换,进行进一步的处理。
透视变换之后-
我使用的算法如下-
找到拐角点-
这种方法适用于像这样的图像。但是,正如你所看到的,许多正方形板都有一个底部,它在顶部和底部都是弯曲的。有时,底部是一个大的圆形板。用这些图片我的方法失败了。示例图像和输出-
圆底座板:
使用上述方法发现的要点:
我可以发布更多这样的有问题的图片,但是这个图片应该给你一个关于我正在处理的问题的想法。我的问题是-
当图像中也有圆形板时,如何找到矩形板?
我想说几点,,-
如果需要的话,我愿意分享更多这样有问题的图片。谢谢!
EDIT1 @Silencer的回答对我识别图像中的字母非常有帮助,但我想准确地找到图像中单词的位置。因此,我觉得识别行和列是必要的,只有在对板应用透视图转换时才能这样做。
发布于 2017-12-25 10:06:51
发布于 2017-12-27 07:19:41
我认为消音器已经给出了很有希望的解决方案。
但是要执行透视转换,正如您前面提到的,您已经尝试过用hough线来查找最大的矩形,但是它失败了,因为现在的瓷砖已经出现了。
如果你有大的图像数据集,可能超过1000幅图像,你也可以给出一种基于深度学习的方法,你可以训练一个模型,以图像作为输入,相应的矩形边界点坐标作为输出。
https://stackoverflow.com/questions/47967070
复制相似问题