快速去除天猫工商执照图片纯色水印

一、前言

在之前的文章:使用Python爬取天猫店铺联系方式|思路与方法 中我们介绍了如何使用Python采集天猫店铺的企业联系方式。

在采集的过程中,我们有两个地方需要对图片进行处理,其中一个是验证码:

在这里我们需要将验证码下载到本地并进行验证码识别。第二个地方则是店铺工商执照的照片:

图片是带有天猫的灰色水印的,我们将图片下载下来:

如果这样直接对图片进行ORC文字识别,有可能会导致不能正确识别出公司名称来。我们需要对水印进行去除。

二、使用OpenCV快速去除水印

要对普通的图片水印进行去除,我们可以对图片进行灰度转换,然后再进行二值化转换。但是这样的方法容易造成图片的失真。

针对如上图这种配色单一的水印图片,我们可以直接将水印颜色填充替换为白色,从而实现水印的快速去除。

核心代码如下所示:

import cv2
import traceback
try:
    # 读取图片
    img = cv2.imread(filename)
    # 获取图片大小
    x, y, z = img.shape
    for i in range(x):
        for j in range(y):
            varP = img[i, j]
            if sum(varP) == 687:
                img[i, j] = [255, 255, 255]
    cv2.imwrite('zmister_qushuiyin.jpg', img)
except Exception as e:
    print(traceback.print_exc())

这样,我们的图片就可以快速去除天猫的水印:

三、使用PyQt5制作成桌面程序小工具

上面的代码快速地实现了天猫文字水印的去除,但是作为代码本身就不方便传播和使用。索性借助于PyQt5,我们将其打包为一个桌面图形界面程序。

这样,一个简单的去水印桌面小程序就写完了。需要源码的可以回复关键字“去水印源码”进行获取。

原文发布于微信公众号 - 州的先生(zmister2016)

原文发表时间:2018-06-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Golang语言社区

【Go 语言社区】算法课程 第一季 第5节 回文检查

回文概念:大致就是把这个数倒过来念数字还是和原来的一样. 运行结果: 代码: package main import ( "fmt" ) //...

3214
来自专栏HTML5学堂

IE hack技术

HTML5学堂:我们平日说的IE hack到底是什么,随着浏览器的发展,IE的hack技术也在不断的发生着变化,一起看看最新的IE hack。 何为hack? ...

2976
来自专栏IMWeb前端团队

怎样打造一个DOM元素位置引擎 (一)

本文作者:IMWeb forsigner 原文出处:IMWeb社区 未经同意,禁止转载 碎碎念 这是一篇早就应该写的文章,但是由于过年前项目紧张,一直...

18810
来自专栏css新特性

CSS利用@font-face使用自定义字符和图标

590
来自专栏姬小光

姬小光前端兴趣班【第010期】- 浏览器开发工具

前面几期我们学习了切图大法,我相信只要你认真学完,就可以立即派上用场。比如可以将你喜欢的图片切成个人主页,也可以将贺卡图片做成带链接的邮件等等。

832
来自专栏测试2017

test

Markdown 是用来生成 HTML 结构的。样式和结构分离,算是其设计思想之一。而这也是现在 HTML 的发展方向。作为印证,<center> 这样的纯为样...

2150
来自专栏非著名程序员

推荐几个比较炫酷效果的开源项目和开源库

上次推送了一篇关于推荐开源项目和开源库的文章,引起的反响不错,那我就持续搞下去,继续分享我收藏和看到的不错的开源库。相信这些推送应该对大家的帮助很大。 Shin...

2878
来自专栏练小习的专栏

用TAOBAO的方法隐藏多余的线条

偶然的看到了TAOBAO UED团队的BLOG,在上面看到了篇文章,说的是怎么隐藏导航最后一项的竖线 1、类目之间的横竖线 ? 从很久很久以前开始,类目间的竖线...

18910
来自专栏九彩拼盘的叨叨叨

我完成的百度前端技术学院任务列表

962
来自专栏较真的前端

HTML 5.2 新特性

1575

扫码关注云+社区