前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >头条没有排面,百度没有未来!

头条没有排面,百度没有未来!

作者头像
数据猿
发布2019-05-14 16:46:07
5730
发布2019-05-14 16:46:07
举报
文章被收录于专栏:数据猿数据猿数据猿

来源:互联网圈内事丨文:贾琦

4月26日,百度与今日头条掀起了起诉大战。当日上午百度以不正当竞争为由起诉今日头条,海淀法院已立案。起诉理由是,今日头条大量窃取百度“TOP1” 搜索产品结果,要求字节跳动立即停止侵权,赔偿相关经济损失及合理支出共计人民币9000万元,并连续30天在其APP及网站首页道歉。

随后,字节跳动来了一招慕容复的斗转星移,一模一样的招式打了回去。

当日下午,与今日头条同属字节跳动的抖音宣布了对百度的起诉。同样由海淀法院受理,同样以不正当竞争为由,称发现百度在搜索中窃取了海量抖音短视频。并作出了同样的要求:立即停止侵权,赔偿9000万元,并在百度首页连续道歉30天。

百小度和头小条各自拖着鼻涕,互相拉扯着到老师跟前,围绕着“他动我橡皮”和“他拿我铅笔”争了起来,谁也不服谁。

这故事多少有些喜感。

由于双方索赔一模一样,有网友评论说“你俩兑了得了,就别遛人家海淀法院玩了。”

还有那过路的,瞥了一眼说:“都不是啥好东西,打打打!狗咬狗!”

俨然一副喜气洋洋的吃瓜现场。

但是,两个估值千亿级的企业当街吵架,其目的绝不是为了给大家演一场闹剧。

01

爬虫之争

双方互诉当天,恰好是世界知识产权日。

无独有偶,前些日子视觉中国也刚刚因为一系列骚操作而被网友广泛关注,最终被有关部门要求关停整改。随着这一事件的热议,版权问题终于进入了公众的视野之中。

此次互诉,百度称“TOP1”产品,是百度 2017 年初推出的“搜索结果首条直接满足”搜索产品的简称。该产品属于百度在AI领域的前瞻性探索,需要极高的技术运用,也需要强大的生态运营能力,百度为此投入了大量人力物力。

而抖音反诉的理由则是百度推出的“简单搜索”中收录了抖音内部的大量短视频。

从诉讼理由中我们可以看到双方并没有针对某一项具体的内容展开版权方面的争论,而是对数据抓取这一现象进行了维权诉求。

换言之版权并不是此案的焦点,而“利用网络爬虫获取数据”这一技术手段的边界,才应该是双方讨论的中心。

据法律界业内人士介绍,网络爬虫作为获取数据的一种技术手段,本身具有中立性,不存在违法违规之处。但由于数据本身的属性存在不同,所以利用网络爬虫获取数据也就存在罪与非罪之分。

具体来说主要应关注两点:第一,是否有权获取数据,第二,是否获取的是公开数据。

倘若遵循以上两项原则,那么爬虫技术的应用只是加快了数据获取的效率,并不构成违法行为。而本案中,由于双方平台内容的公开性,那么无论是百度对抖音视频的抓取,抑或是今日头条对百度搜索结果的引用,都没有违背“非法获取计算机信息系统数据”这一罪名。

尽管如此,我们倒也不能说此次诉讼压根就师出无名。事实上早在2017年就曾有过类似的案件轰动全网。案件的主角一边是大众点评,而另一边同样是百度。

当时百度公司通过搜索技术从大众点评网等网站获取信息,并将搜索引擎抓取的信息直接提供给网络用户,最终被上海知识产权法院认定为不正当竞争行为。判决书主文指出,“百度公司的搜索引擎抓取涉案信息并不违反Robots协议,但这并不意味着百度公司可以任意使用上述信息,百度公司应当本着诚实信用的原则和公认的商业道德,合理控制来源于其他网站信息的使用范围和方式。”

也就是说,在该案件中法院评判百度与大众点评构成不正当竞争的逻辑,根本不在于百度利用网络爬虫获取大众点评的数据,而是百度违反公认的商业道德,任意使用其获取的数据。

那么在本次的双方互相诉讼中,“公认的商业道德边界”,以及是否“合理的控制了来源于其他网站信息的使用范围和方式”,将成为最终判罚的关键依据。

具体的谁是谁非需要法庭去进一步详细听证,而本文中所需要讲述的重点,则在于上文中提到的Robots协议。

早在上个世纪90年代,关于搜索引擎抓取的范围限定就已经有了相关的行业规范,即robots.txt协议,也叫爬虫协议。而站点可以通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。这一协议被几乎所有的搜索引擎采用,包括谷歌,百度,必应,搜狗等。

以淘宝网为例,早在2008年淘宝就决定全面屏蔽百度搜索引擎的抓取,而至今为止我们也无法在百度中直接搜索到淘宝商品的页面内容。

User-agent: Baiduspider

Disallow: /

User-agent: baiduspider

Disallow: /

淘宝网的 Robots.txt文件

换言之无论是百度还是抖音,如果真的不想被对方的爬虫抓取的话,只需要在自己的协议中增添几行代码便是。从这一点我们也可以看出,此次双方的诉讼,从一开始就不是技术之争。

02

商业之争

互联网是个百花齐放的世界,早期的时候许多技术极客都在这个领域里实现了自己的种种美好设想。

回顾互联网领域的早期历史,在许多里程碑式的互联网产品的产生故事中,我们都能看到“大家开心就好”,“一开始就是为了玩”,“我用的不舒服,那我就自己做一个”等诸如此类的言语。

那时候盘子还很小,一切都很单纯,互联网世界仿佛是一个只关乎技术和需求的理想国。

但商业是另一个世界,所遵循的也是另外一套逻辑。

盈利,这是商业世界的首要原则。

十多年前,即二零零几年的时候,那时候人们对互联网世界充满遐想,所有的线下企业都以为自己要死了,而互联网企业则认为自己终将上天入地,覆盖所有。

但经过十几年的发展,人们逐渐意识到商业法则的限制,凡是不能达成“盈利”的创新,在最后都将被定义为“伪需求”。

遵循这一原则,我们发现互联网领域内最成熟的变现途径,或者说最大的市场蛋糕一共有三块,分别是:广告,游戏还有电商。作为一家互联网企业,如果你想挣钱,特别是想挣大钱,那你终究得接入这三个领域。

在PC时代,百度手握全网最大的流量入口,在广告这一领域吃得满嘴流油。而在移动互联网时代,百度正在被网络全面抛弃。

今年年初,一篇《搜索引擎百度已死》引爆网络,文章的主旨内容是“在百度中的搜索行为,绝大多数都会被导流给百度自己的百家号。而百度已经从一个搜索引擎变成了营销号平台。”

文章还称,“百度已经不打算好好做一个搜索引擎了,这个策略给我的感觉,就像在末日来临前拼命挥霍光财产。”

但老实说,站在百度的角度去看这一问题,由于近些年来中国互联网愈演愈烈的分割和封闭趋势,百度的信息之源已经从根本上就枯竭了。百度没有能力,也没有机会去抓取到优质信息了。

现如今当人们需要搜索衣物的商品信息时,他们会直接打开淘宝;当人们需要阅读长文章时,他们会直接打开微信;而当人们需要知道哪家店更好吃时,他们会直接打开美团。

人们的需求被产品经理一件又一件挖掘出来,与之相随的,可商业化程度高,搜索频繁的领域也一个接着一个被带离了百度。

信息岛屿的格局正在不可避免地形成,而搜索引擎需要的是海。

延续这一逻辑我们不难得出结论:百度的主营业务“搜索”正在坍缩,并且在可预见的未来仍将持续坍缩。

同时从这个角度来说,他的敌人也并不是某一家公司,而是每一家有权决定不开放接口给他的互联网企业。

诞生于移动互联网时代的今日头条,近些年在流量上斩获颇丰,而其迅速增长的广告营收,很难不让百度将其视为虎口夺食的“篡位者”。

尽管在商业角度来看,二者在同一市场内形成了激烈的竞争格局,但细究其经营模式,二者之间有着天差地别。

就百度搜索引擎而言,其所遵循的商业模式在于分析用户的搜索关键词,并给出相应的匹配。而就今日头条而言,其所遵循的商业模式则是基于用户行为,通过智能算法所进行的数据流主动推送。

有人说今日头条的成功很大一部分得益于其踩中了“下沉市场”,这样的说法其实是因果关系的倒置。

事实上,今日头条的成功在于其通过智能算法的应用,帮助其找到了现如今中国最大的流量来源,而这个来源恰好就是“下沉市场”。也就是说,今日头条对下沉市场的迎合,是整个智能算法的决策结果,而不是一开始的决策动因。

换言之随便再换任何一个文化背景,今日头条的算法都将筛选出最受欢迎的那类内容。

在商业模式上,头条也走的是内容市场那一套。2018年已经实现了500亿-550亿的营收目标,并且将2019年的营收目标瞄准在了1000亿。

要知道技术驱动的产业发展,一般都逃离不了高德纳的“技术成熟度曲线”模型(Gartner Hype Cycle),分别是启动期,低谷期,爬升期和高原期。

字节跳动的核心技术是AI,而该技术在2018年已经开始走向了大规模落地,不只是字节跳动,越来越多的公司用AI技术赚取到了大量的真金白银。

可以判断现如今AI技术已经进入了爬升期,并在接下来的几年里助力字节跳动在内容领域持续斩获流量和相应的利益。

过去十几年来,百度就像是一个游乐场前收门票的,游乐场里的人拼死拼活地创新运营,而百度赚得盆满钵满。

现如今经历过移动互联网时代后,游乐场的围栏被拆得七零八碎,百度搜索引擎的入口位置被持续边缘化,而游乐场里的几家经营单位则越长越大。

刀刀割在身上,百度难免会觉得痛。

回到我们一开始提到的两起诉讼案,对百度而言,心情或许真的是委屈。作为一个搜索引擎,你不能说百度一点都没努力。诉讼中提到的“TOP1”产品,其目的就是希望让用户在搜索一个关键词后在搜索结果的第一条就能得到自己想要的结果,省去了筛选的过程,让搜索的过程体验更好。

尽管如此,百度还是因为我们上述所提到的种种不可抗力被抛弃了。但你们抛弃人家也就算了,还直接把人家辛辛苦苦研发出来的技术用爬虫爬过来用于优化完善自己的产品,百度不可能不感到委屈。

至于抖音紧跟着的起诉,纯粹就属于公关防御技巧。一波打下去先把水搅浑,而目前观察舆论的反应,也已经达到了想要的目的。

03

未来之争

就互联网广告市场而言,转换率,流量,精准匹配度这几项标准将极大决定广告商的价值。今日头条依仗其算法优势,在短期未来内依然会在这几项上保持全面领先。

至于百度,从17年底就开始全面diss互联网,李彦宏多次在公开场合下直言:“互联网时代已经结束,下一幕是人工智能。”

既然如此,想必百度内部也会非常清楚,随着“互联网时代的结束”,百度在互联网时期的巅峰产品“百度搜索引擎”也终将迎来告别。

就在双方提起诉讼的同一天,百度浏览器也发布公告:产品将不再更新。

认定“互联网时代已经结束”的百度,必然应该在心理上做好了充分的告别准备。

在人工智能领域,无论是百度ai开放平台的建立,抑或是智慧城市、百度大脑、无人驾驶阿波罗计划等一系列项目的筹备工作,都为百度在该领域的爆发奠定了极强的基础。

互联网的未来没有百度搜索引擎,而百度在赌互联网没有未来。

AIoT极有可能是下一个时代的主流,下一代的搜索入口很有可能是以语音为载体的智能音箱,而这一切都在百度的设想范畴里。

只是,作为搜索引擎的百度已经陪伴了我们太久,也同样对作为公司的百度意义非凡。

也许多年后,百度赌对了,作为一家成功的人工智能企业再一次站上商业之巅。那时候孩子们会问起这家公司名称的来由,听完后也只会似懂非懂。

搜索引擎当死。

而“众里寻他千百度”的美感,终将模糊在时光里。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-04-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据猿 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档