专栏首页AI算法与图像处理大规模水印图像数据集开放,水印处理研究再不用担心没有数据

大规模水印图像数据集开放,水印处理研究再不用担心没有数据

来源:视说AI 写在前面

水印作为一种保护版权的有效方式被广泛地应用于海量的互联网图像,针对水印的各种处理显得越来越重要。在之前的两篇文章《AI技术在图像水印处理中的应用》和《生成对抗网络玩转图像水印》中,已经介绍了当前利用深度神经网络来实现水印的检测和去除的一些研究。

基于深度学习的水印处理需要海量水印图像作为数据基础。然而现实中并没有直接可以使用的水印图像数据,为此制作了首个大规模水印图像数据集(Large-scale Visible Watermark dataset, LVW)用于学术研究。为了更好地方便大家的学习和使用,LVW数据集已经开放下载【仅供学术研究,勿作他用】,希望能够为水印处理智能化的研究添砖加瓦。

数据集介绍

LVW数据集由6万张带水印图像组成,包含了80种来自于公司、组织和个人的水印,包括了中文、英文和logo等不同样式,每种水印对应750张图像。为了保证图像数据的一般性和可用性,公开的PASCAL VOC 2012数据集的图像被作为原始的无水印图像,然后将上述80种水印以随机的大小、位置和透明度打在原始图像上,同时记录下水印的位置信息。

为了适应现实场景中需要机器自动处理从未见过的水印和图像的需求,需要确保训练集中的水印和图像都不会出现在测试集中,这样可以很好地模拟现实生活中的使用场景。具体地,在80种水印中,64种水印被作为训练水印,剩余的16种水印被作为测试水印。同时,训练集图像从PASCAL VOC 2012数据集的训练和验证图像中挑选,而测试集图像从PASCAL VOC 2012数据集的测试图像中挑选。

使用说明

开放LVW水印图像数据集的目的是为了能够为水印处理的研究尽一份力,所以数据集仅限于学术研究使用,禁止商业应用和其他用途。

为了方便与无水印原图对比,PASCAL VOC 2012数据集的图像及其与带水印图像的对应关系也一并提供。考虑到存储和下载等各方面因素,LVW数据集暂时存于百度云。

如果在研究中使用了该数据集及相关资料,请引用下面的文章:

[1] Large-Scale Visible Watermark Detection and Removal with Deep Convolutional Networks.

[2] Towards Photo-Realistic Visible Watermark Removal with Conditional Generative Adversarial Networks.

写在最后

针对水印的各种处理一直是研究的热点,也吸引了越来越多的关注。值得注意的是,版权保护是大家一直要坚持的事情,水印处理的学术研究初心是为了促进水印鲁棒性的提升。正如在《Towards Photo-Realistic Visible Watermark Removal with Conditional Generative Adversarial Networks》论文中最后提到的一样:“Significantly, our original intention is to increase the awareness on the copyrights of online images, reminding that visible watermarks should be designed to be more resistant against removal attacking. Developing a more robust watermarking technique for copyright protection is challenging and part of future work.” 水印处理和保护未来的研究之路还很长,需要我们大家一起努力。

本文分享自微信公众号 - AI算法与图像处理(AI_study)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-11-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 9102年的数据泄漏,裸奔的不只是你的个人信息

    日前,疑似“陕西普通话成绩查询网(sxpth.cn)”由于网站的程序员把所有考生信息(包括照片、身份证、准考证号、院校等)通过硬编码的方式直接写进了网页源代码里...

    AI算法与图像处理
  • 从LeNet到GoogLeNet:逐层详解,看卷积神经网络的进化

    深度学习的兴起使卷积神经网络在计算机视觉方面大放异彩,本文将按时间和创新点顺序介绍一系列网络结构:LeNet、AlexNet、VGGNet、InceptionN...

    AI算法与图像处理
  • 预学无门?一份超赞的PyTorch 资源清单,已翻译成中文版!

    在被华为的面试官吊锤之后,我深刻明白入门和入行的差距了,入门可能只是别人说的一些概念你能有了解了,而入行则是我交代的任务你能完成。当然认识到问题之后,还是需要...

    AI算法与图像处理
  • 谷歌发明图片批量去水印新算法,呼吁素材网站将水印随机化

    安妮 编译整理 量子位 出品 | 公众号 QbitAI 图片素材网站为了保护版权,通常要将图片打个水印。 但最近,谷歌的研究人员发现了一种新算法,可以轻松批量将...

    量子位
  • 业界 | 谷歌提出多图像抠图算法,并弥补水印技术的一致性漏洞

    机器之心
  • 利用AI技术去除图像水印

    作者简介:李翔,国内某互联网大厂AI民工,前携程酒店图像技术负责人,主导并参与一系列图像智能化算法的研发与落地工作。在ICCV和CVPR等学术会议及国际期刊上发...

    数据森麟
  • AI技术在图像水印处理中的应用

    作者简介:李翔,国内某互联网大厂AI民工,前携程酒店图像技术负责人,主导并参与一系列图像智能化算法的研发与落地工作。在ICCV和CVPR等学术会议及国际期刊上发...

    材ccc
  • 《Streaming Systems》第三章-水印

    在上文提到过,水印是数据完整性的度量,也就是说,水印决定了流处理系统(以下用“系统”代指)何时关闭事件时间窗口(event-time window),不再接收任...

    哒呵呵
  • 如何利用深度学习技术处理图像水印?

    作者简介:李翔,国内某互联网大厂AI民工,前携程酒店图像技术负责人,主导并参与一系列图像智能化算法的研发与落地工作。在ICCV和CVPR等学术会议及国际期刊上发...

    AI科技大本营
  • 水印第三版 ~ 变态水印(这次用Magick.NET来实现,附需求分析和源码)

    技能 汇总:http://www.cnblogs.com/dunitian/p/4822808.html#skill 以前的水印,只是简单走起,用的是原生态的方...

    逸鹏

扫码关注云+社区

领取腾讯云代金券