一个叫「黑洞」的人工智能

mixlab

发布于 2019-05-05 15:17:56

6900

发布于 2019-05-05 15:17:56

文章被收录于专栏：MixLab科技+设计实验室

本文讨论一个图片版权AI引擎的缘起，及其DIY路径。

[ 首张黑洞照片.JPG ]

请自行脑补，

因为我怕「视觉中国」找我麻烦……

「视觉中国」黑洞事件

我们先来回顾下这几天热门的视觉中国黑洞事件，事情是这样的：

4月10晚，人类首张黑洞照片问世，这张照片在网上瞬间刷屏；

但有网友称，「视觉中国」已在国内获得此黑洞图片的版权，并注明若用于商业用途，请联系客户代表。

该消息一出，引发了全网对「视觉中国」图片版权的激烈讨论；

“没收到过视觉中国的律师函，都不配称为媒体！”

此时，共青团中央官方微博也发微博质问：

“国旗、国徽的版权也是贵公司的？”

该微博发布立即引发了上万次的转发，及超万次的点赞。

多家企业质疑自己LOGO图片“被版权”

中国警察网、深圳交警、南孚电池、凤凰网科技、苏宁易购、360网站、健力宝饮料、海尔公司、阿里健康、长虹集团、携程旅行等超50家企业发出微博表示疑惑——

为何企业产品或LOGO等图均被收录进视觉中国？

随后，天津市网信办连夜约谈「视觉中国」，「视觉中国」官网也暂时关闭整改。官方的回应是：

“经查该图片由视觉中国签约供稿人提供，视觉中国作为平台方负有审核不严的责任，为此深表歉意！”

：：甩锅给供稿人（广大的网民们）

采用大数据、

人工智能技术，

全网检测版权图片使用情况

视觉中国是一家什么样的公司？

官网资料显示，视觉中国是一家国际知名的以“视觉内容”为核心的互联网科技文创公司，2014年成功在A股上市；

核心技术是，基于大数据、人工智能技术，通过互联网版权交易平台提供亿级图片、视频及音乐素材，为内容生态中的生产者与使用者提供版权交易和增值服务。

在线收录超过2亿张图片、500万条视频素材和35万首各种曲风的音乐或音效。

大致的技术是：

抓取自媒体的文章中的图片

提取图片特征

与数据库中版权图片进行对比

计算出相似程度

判断自媒体是否是付费使用

若不是付费使用，则列出自媒体的名录及文章清单

这个时候，客户人员就会拿着这个名单，去开始取证，要求自媒体付费使用，即“维权”。

mixlab免费图片版权引擎

black hole

网上有大量的免图片版权网站，例如

https://freephotos.cc/zh

https://www.foodiesfeed.com/

https://www.reshot.com/

https://stocksnap.io/

https://unsplash.com/

基于它们的图片，我们可以用爬虫收集下来，然后构建我们的一个图片搜索引擎，对外提供一个以图搜图的接口。

使用的场景是这样的：

STEP1

用户写完文章、配好图

STEP2

把文章中的图片，以图搜图的方式，进行查询

STEP3

根据一个相似度的阈值，判断图片是否免费可商用

STEP4

输出可免费商用的图片标记

以图搜图的技术原理，可以查阅mixlab的往期文章：

以图搜图技术栈

DIY一个以图搜图引擎1

可选苹果的turicreate或者基于ElasticSearch的lire框架。

技术路线介绍完啦，我们为此图片版权AI引擎，取名为「黑洞」。

除了使用图片版权检测引擎，

我们还可以选择人民网的图片服务

人民网据说要进军图片版权领域，据网上4月14日的报道，人民网旗下的“人民图片网”愿与兄弟媒体携手探索，为主流媒体提供便捷高效的图片管理服务系统，搭建一个优质新闻图片版权交易平台。

最后，

在此希望人民网提供更为合理的版权使用机制，

最好人民网可以提供开放平台，

好让我们程序员可以再此基础上进行二次开发。

欢迎在MixLab讨论相关内容、技术实现，

MixLab是一所面向未来的实验室

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2019-04-15，如有侵权请联系 cloudcommunity@tencent.com 删除

https

网络安全

大数据

本文分享自无界社区mixlab 微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

https

网络安全

大数据

登录后参与评论

0 条评论

热度