起因
最近经常被要求手机拍摄考试卷,但是拍摄完之后,跟实际的黑白考试卷有很大的色差,打印出来之后背景就变成了灰色,看着很不舒服。于是我想起了好久以前,我用过的一个软件叫全能扫描王,发现它里面是有去除这种文本底色的功能的,但是有时候也很坑!我就想手动写一个简单python程序来实现。最终我写出的程序测试效果如下:
左侧是用手机拍摄的图像,右侧是用opencv-python处理之后的结果。
思路分析
首先看一下输入的原图,(小学生作业找不到了,让我给他打印是起因,他要手写,我说我来处理一下打印出来),别人拍的原图:
我发现这些图像基本上都是黑白纸张或者有些有虚线的纸张,我首先想到把文字部分从输入图像中都抠出来来,不需要太精准,大致就可以了,所以要获取图像中文字的mask,我就想到了用二值化的方法,我首先尝试了全局二值化OTSU与三角法来获取mask,发现效果都有点坑爹!图示如下:
最终效果是这样,而当光线稍微有点不均匀的时候,这个就直接在二值话时候翻车了!会丢失信息,所以我想到了用自适应的二值化方法,最终选择:
binary = cv.adaptiveThreshold(image, 255, cv.ADAPTIVE_THRESH_GAUSSIAN_C, cv.THRESH_BINARY_INV, 25, 15)
该函数来完成二值化,实现mask提取
提取完成之后,通过了一个形态学操作来实现简单的膨胀操作,这样确保每个字像素范围足够大,不会丢失。最终自适应的mask:
然后与原图实现与操作,得到真实文字区域,使用mask区域取反得到mask1,然后对mask与输入的灰度图像完成bitwise_and操作,得到的结果与mask1相加即可得到最终的效果,图示如下: