首页
学习
活动
专区
工具
TVP
发布

云里的×片儿是如何被屏蔽的?

每次文章写久了就会滋生疲倦感,会厌倦。这时候就想打开某云消遣一下,点开层层目录,一片世外桃源:

英语四六级

马克思理论文学知识

我的网盘>开发语言>软件工程实战指导>xxx.omg、yyy.sht、zzz.orz

各种后缀名百花齐放,正美滋滋幻想着苍老师的憨笑,不曾想蹦出了马老师的咆哮,整个人都炸了。。。

怒发冲冠凭栏处,

潇潇雨歇含泪眼。

明明已经改了名字,还改了后缀名,某云是怎么识别出来的?扎心了老铁。各位撸友稍安勿躁,且听老司机来给你们科普科普(如果对这段数据没兴趣请直接拖到最后蓝色字体部分:)

在计算机的世界里,只有和1,和生物界一样,只有公和母。这是计算机信息的最小元素,叫位,单位是比特,二进制的。上帝创造了亚当和夏娃,人类创造了0和1,这两个神奇的数字,组成了计算机世界的一切,包括你的片儿。

8位数字组成一个字节,它是最基本的数据单位,虽然比特是最小的单位,但是在计算机中实际不会看到这个层级的数据,因为太小了。一部1G的片,换算成最小单位就是

1G =1024MB= 1024*1024KB

= 1024*1024*1024 =230

= 1,073,741,824B

= 8,589,934,592b

接近86亿比特。这真是个天文数字,这么巨大的信息量直接比较是不可能的,咋整?这就需要攻城狮出马了。

某云如何识别*片的?

为什么伪装的很好的*片仍会被纠出来呢?基本原理是这样的:先找出范本,然后比较。范本哪来的?当然是革命队伍中出现了叛徒。

但是怎么比较就是个技术活了,从上百上千万视频中比出毛片并非易事,绝不可能通过肉眼识别,也不可能是整个视频比较。因为一部几十分钟的视频,大小有几百兆到几个G不等,而且还是压缩编码的,没有系统会将其解码后再比较。这里就需要引入一个技术术语,叫做信息指纹。

任何一段信息(文字、语音、图片、视频)都可以对应到一个不太长的随机数,作为区别它和其他信息的特征,就像人的指纹(FingerPrint),所以叫信息指纹。

视频的匹配有两个核心技术,关键帧的提取和特征的提取。视频虽然每秒有30帧图像,但是每一帧之间差异不大(否则我们看起来就不连贯了)。只有极少数的帧是完整的图像,这些称为关键帧。其余帧存储的只是和关键帧相比的差异值。关键帧对于视频的重要性,就如同主题词对于新闻的重要性一样。因此处理视频图像首先要找到关键帧,接下来就是要用一组信息指纹来表示这些关键帧了。

有了这些信息指纹后,接下来查*片的事情就是比较所有文件的信息指纹是否相同了。所以识别步骤大致是这样的,假设很不幸,某部*片被纠出来了,攻城狮们就会根据这部片的关键帧,制作出一套信息指纹,去和服务器上所有的视频匹配,匹配上就是杀无赦斩立决,基本上是宁可错杀三千不可放过一个的态势。于是大家就看不到苍老师看到马老师了。攻城狮们是不是很酷,其实谁知道他们内心是不是也在滴血呢,所以才需要鼓励师来抚慰啊。

既然大家知道原理了,自然就想怎么破解。一种方法是做成压缩文件存放,但这些资源本身就是从其他地方转存过来的,下载压缩上传,需要的时候还得下载解压,有一种远水解不了近渴的感觉。笔者有一个好方法,那就是……

撸海无涯,

回头是岸。

(如果大家有化腐朽为神奇方法,欢迎留言分享)

据说YouTube就是用使用信息指纹技术识别出相同的视频,再根据上传时间判断出谁是原创,并制定了一个很有意思的广告策略:所有拷贝视频的收益全部归视频的原创者,比如广告是插入在拷贝的视频中,广告的收益也会归原创。这样一来,所有拷贝和上传别人视频的网站就不可能获得收益。没有了经济利益,也就少了很多盗版和拷贝。

信息指纹是项好技术,用途也绝不仅于此。他与密码学的关系就相当于区块链与比特币的关系。信息指纹的一个特征就是不可逆性,也就是说,无法根据信息指纹逆运算出原来的信息。这种性质,正是网络加密传输及存储所需要的。

在互联网上生成信息指纹的算法,常用的有MD5和SHA1。他们可以将不定长的信息变成定长的128位或者160位二进制随机数。值得一提的是,两种算法都还可以引入一些干扰信息(比如双方约定的密钥)一起进行运算,甚至多次运算,这种天知地知你知我知的操作,引起了黑客界的共愤,但保护了信息传输的安全。目前一些大银行和BAT都有采用这种技术。

正如

“关于我们”

一文里所说,我不希望沉浸在文字中不能自拔。更不能沉浸在*片里不能自拔,尤其是青少年,毕竟强撸灰飞烟灭,吾辈心中当有一少年中国说:

少年智则国智,少年富则国富;

少年强则国强,少年独立则国独立;

少年自由则国自由;少年进步则国进步;

少年胜于美洲,则国胜于美洲;

少年雄于地球,则国雄于地球。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180717G0TPMO00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券