首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

刚刚,知乎不让第三方爬虫抓取了

今天是世界知识产权日,多家内容平台出台了相应的保护知识产权措施,知乎的举措,是禁掉了即刻等第三方爬虫的抓取

在一则公告中,知乎宣布“针对除信任的搜索引擎外的第三方机构,将采取白名单许可的方式,开放知乎内容的使用”。

也就是说,除了搜索引擎,其余类似于即刻、今日头条、印象笔记等APP要想抓取知乎的内容,必须向知乎申请开通白名单。

开通白名单的要求是:

遵循协议,不去获取知乎禁止抓取的内容页面,包括但不限于用户设置了禁止转载的页面;

符合 CC 协议,如果需要以原生页面展示知乎内容,必须提前获取用户授权;

不对知乎页面做转码、缓存操作。用户或知乎对内容作出修改、删除等操作时,需有即时同步机制;用户做实名匿名的展示切换时,必须即时同步修改;

保护知乎用户包括但不限于用户针对站外展示做的隐私、图片水印和禁止转载等设置的权利;

我想,知乎做出这个决定,无非有两个原因,那就是保护用户,也保护自己。

一方面,是保护用户的知识产权和隐私权

知乎是一个知识社区,对内容创者者权益的保护是立身之本。知乎用户可以设置禁止转载,需要付费授权才能转载等来保护自己的知识产权。

然而,一些第三方爬虫却无视这些规则,随意的抓取禁止转载或者需要授权才能转载的内容,显然是对用户知识产权的一种践踏。

知乎回答问题和提问时是可以匿名的,有些用户一开始可能是实名,但问题火了或者有了新的顾虑还可以选择变成匿名,但爬虫抓了之后不会同步这些更新,用户的隐私就得不到保护。

除了这个举措,知乎还计划近期升级自己的隐私保护政策,为用户提供更好的隐私保护,更重要的是,让用户清楚明了的知道隐私在哪些时机场合使用了,还用户以知情权。

另一方面,是减少第三方的转码缓存截流

知乎其实很爱惜自己的羽毛。

按照用户协议,知乎是有权在自己的各种渠道中使用用户内容的,但他们一直很注意尊重用户的意愿。在使用用户贡献的内容时,要么直接使用原生页面,要么就告知用户请求授权后才使用。

而现在,一些第三方爬虫不但不打招呼就随意抓取,而且还对内容做转码、缓存甚至是编辑等处理,这种野蛮的截流方式,知乎当然不乐意了。

所以,于公于私,知乎都不能让大大小小的第三方爬虫继续这么干了。

不过,和微博直接封掉今日头条的接口不同,知乎并没有完全把路堵死,只要你申请开通白名单,遵守这些合作原则,还是可以继续进行内容共享的,毕竟,流通的内容才更有价值。

知乎一直是一座内容宝库,拥有许多高质量的内容,也一直是被内容侵权的重灾区。

遥想微信公众平台创立之初,好多公众号都是靠抄知乎内容起家的,后来知乎建立健全了版权保护机制,甚至起诉了“知乎大神”等微博微信号,才刚刚有所好转,这边又被一些第三方爬虫无节制的抓取,希望这次的白名单制度能够规范抓取,还知乎社区和创作者一个良好的环境。

在保护版权的同时,知乎也应该想一些帮助内容更好的输出、让用户获利受益的方式,这样才能实现最大程度的共赢。

对于即刻等APP来说,恐怕得重新思考对内容的抓取和使用方式的问题了。不止是知乎,对于其他的内容源也得未雨绸缪,汲取当年头条的版权教训,及早弥补版权短板才是王道,而不是盲目求大,去做什么类似于微博的动态信息流。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180426A1WR4400?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券