快速去除天猫工商执照图片纯色水印

一、前言

在之前的文章:使用Python爬取天猫店铺联系方式|思路与方法 中我们介绍了如何使用Python采集天猫店铺的企业联系方式。

在采集的过程中,我们有两个地方需要对图片进行处理,其中一个是验证码:

在这里我们需要将验证码下载到本地并进行验证码识别。第二个地方则是店铺工商执照的照片:

图片是带有天猫的灰色水印的,我们将图片下载下来:

如果这样直接对图片进行ORC文字识别,有可能会导致不能正确识别出公司名称来。我们需要对水印进行去除。

二、使用OpenCV快速去除水印

要对普通的图片水印进行去除,我们可以对图片进行灰度转换,然后再进行二值化转换。但是这样的方法容易造成图片的失真。

针对如上图这种配色单一的水印图片,我们可以直接将水印颜色填充替换为白色,从而实现水印的快速去除。

核心代码如下所示:

import cv2
import traceback
try:
    # 读取图片
    img = cv2.imread(filename)
    # 获取图片大小
    x, y, z = img.shape
    for i in range(x):
        for j in range(y):
            varP = img[i, j]
            if sum(varP) == 687:
                img[i, j] = [255, 255, 255]
    cv2.imwrite('zmister_qushuiyin.jpg', img)
except Exception as e:
    print(traceback.print_exc())

这样,我们的图片就可以快速去除天猫的水印:

三、使用PyQt5制作成桌面程序小工具

上面的代码快速地实现了天猫文字水印的去除,但是作为代码本身就不方便传播和使用。索性借助于PyQt5,我们将其打包为一个桌面图形界面程序。

这样,一个简单的去水印桌面小程序就写完了。需要源码的可以回复关键字“去水印源码”进行获取。

原文发布于微信公众号 - 州的先生(zmister2016)

原文发表时间:2018-06-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏杨龙飞前端

网页html结构搭建方法总结

3306
来自专栏葡萄城控件技术团队

HTML5 & CSS3初学者指南(1) – 编写第一行代码

介绍 网络时代已经到来。现在对人们来说,每天上网冲浪已经成为一种最为常见的行为。 在网页浏览器中输入一段文本地址,就像http://www.codeprojec...

1936
来自专栏腾讯社交用户体验设计

打造H5动感影集的爱恨情仇(动画性能篇) - 腾讯ISUX

1354
来自专栏较真的前端

HTML 5.2 新特性

1375
来自专栏姬小光

姬小光前端兴趣班【第010期】- 浏览器开发工具

前面几期我们学习了切图大法,我相信只要你认真学完,就可以立即派上用场。比如可以将你喜欢的图片切成个人主页,也可以将贺卡图片做成带链接的邮件等等。

752
来自专栏更流畅、简洁的软件开发方式

学习HTML5之表单

HTML5 的标准已经定了,应该火了,或者已经火了。那么是不是可以学习一下呢? 目前h5的主场还是在手机端,pc还是受困于浏览器的兼容,主要是IE在拖后腿。所以...

2445
来自专栏九彩拼盘的叨叨叨

我完成的百度前端技术学院任务列表

762
来自专栏编程直播室

源码发布:一个Angular写得Markdown编辑器 参考资料

1472
来自专栏Android小菜鸡

LayaAir引擎学习经历

  由于公司任务安排,需要笔者先去了解一下LayaAir引擎库,以用来完成公司将要启动的大数据可视化项目,需要借助LayaAir引擎实现复杂的动画。笔者花两天时...

3062
来自专栏测试2017

test

Markdown 是用来生成 HTML 结构的。样式和结构分离,算是其设计思想之一。而这也是现在 HTML 的发展方向。作为印证,<center> 这样的纯为样...

2070

扫码关注云+社区