首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Google:互联网 60% 是重复内容

出品|开源中国

前几天在新加坡举行的 GoogleSearch Central Live 活动上,Google Webmaster 趋势分析师 Gary Illyes 称,互联网上六成的内容是重复的。

互联网上有大量重复内容是众所周知的事实,问题是比例有多大,作为最大最流行的搜索引擎,Google 给出了它的答案。

当然,大家更想知道 Google 如何定义 “重复内容”。是 100% 完全相同的重复?还是标题不同但实际内容一致的重复,比如社交网络中的转载,或者进行搜索引擎优化之后的重复等。根据 Google 搜索中心文档的解释,重复内容一般是指在域内或跨域的实质性内容块,这些内容与使用同一种语言的其他内容完全匹配,或有一定体量的内容明显相似。

后面参加了此次会议的观众补充了 Gary Illyes 提出此说法时的上下文,主要是在解释 Google 如何处理 “重复数据”,Google 在这里对 “重复内容” 的定义是基于抓取数据的考虑。

1. 删除协议重复的内容 — 有利于 HTTPS

2. 删除 www/non-www

3. 删除包含无用参数的 URL (例如 sessionID?)

4. 删除斜线 / 无斜线的变体

5. 删除其他的校验和重复

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20221129A02DEJ00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券