本文讨论一个图片版权AI引擎的缘起,及其DIY路径。
[ 首张黑洞照片.JPG ]
请自行脑补,
因为我怕「视觉中国」找我麻烦……
01
「视觉中国」黑洞事件
我们先来回顾下这几天热门的视觉中国黑洞事件,事情是这样的:
4月10晚,人类首张黑洞照片问世,这张照片在网上瞬间刷屏;
但有网友称,「视觉中国」已在国内获得此黑洞图片的版权,并注明若用于商业用途,请联系客户代表。
该消息一出,引发了全网对「视觉中国」图片版权的激烈讨论;
“没收到过视觉中国的律师函,都不配称为媒体!”
此时,共青团中央官方微博也发微博质问:
“国旗、国徽的版权也是贵公司的?”
该微博发布立即引发了上万次的转发,及超万次的点赞。
多家企业质疑自己LOGO图片“被版权”
中国警察网、深圳交警、南孚电池、凤凰网科技、苏宁易购、360网站、健力宝饮料、海尔公司、阿里健康、长虹集团、携程旅行等超50家企业发出微博表示疑惑——
为何企业产品或LOGO等图均被收录进视觉中国?
随后,天津市网信办连夜约谈「视觉中国」,「视觉中国」官网也暂时关闭整改。官方的回应是:
“经查该图片由视觉中国签约供稿人提供,视觉中国作为平台方负有审核不严的责任,为此深表歉意!”
::甩锅给供稿人(广大的网民们)
02
采用大数据、
人工智能技术,
全网检测版权图片使用情况
视觉中国是一家什么样的公司?
官网资料显示,视觉中国是一家国际知名的以“视觉内容”为核心的互联网科技文创公司,2014年成功在A股上市;
核心技术是,基于大数据、人工智能技术,通过互联网版权交易平台提供亿级图片、视频及音乐素材,为内容生态中的生产者与使用者提供版权交易和增值服务。
在线收录超过2亿张图片、500万条视频素材和35万首各种曲风的音乐或音效。
大致的技术是:
抓取自媒体的文章中的图片
提取图片特征
与数据库中版权图片进行对比
计算出相似程度
判断自媒体是否是付费使用
若不是付费使用,则列出自媒体的名录及文章清单
这个时候,客户人员就会拿着这个名单,去开始取证,要求自媒体付费使用,即“维权”。
03
mixlab免费图片版权引擎
black hole
网上有大量的免图片版权网站,例如
https://freephotos.cc/zh
https://www.foodiesfeed.com/
https://www.reshot.com/
https://stocksnap.io/
https://unsplash.com/
基于它们的图片,我们可以用爬虫收集下来,然后构建我们的一个图片搜索引擎,对外提供一个以图搜图的接口。
使用的场景是这样的:
STEP1
用户写完文章、配好图
STEP2
把文章中的图片,以图搜图的方式,进行查询
STEP3
根据一个相似度的阈值,判断图片是否免费可商用
STEP4
输出可免费商用的图片标记
以图搜图的技术原理,可以查阅mixlab的往期文章:
可选苹果的turicreate或者基于ElasticSearch的lire框架。
技术路线介绍完啦,我们为此图片版权AI引擎,取名为「黑洞」。
04
除了使用图片版权检测引擎,
我们还可以选择人民网的图片服务
人民网据说要进军图片版权领域,据网上4月14日的报道,人民网旗下的“人民图片网”愿与兄弟媒体携手探索,为主流媒体提供便捷高效的图片管理服务系统,搭建一个优质新闻图片版权交易平台。
最后,
在此希望人民网提供更为合理的版权使用机制,
最好人民网可以提供开放平台,
好让我们程序员可以再此基础上进行二次开发。
欢迎在MixLab讨论相关内容、技术实现,