首页
学习
活动
专区
工具
TVP
发布

网站迟迟不被收录的注意事项

先说一个例子:前段时间我的一个朋友问我,说他自己做了一个网站,创建了几十天了,外链没少发,网站也更新文章了,为什么百度不收录,其他搜索引擎都已经收录了。

网站迟迟不被收录的注意事项

那我给讲了三点:

第一,这个域名以前是否被使用过?有没有黑历史?

第二,有可能并不是不收录,而只是还没更新而已。找找搜索引擎更新的重要时间节点。

第三,重新审视你的外链策略,为未来得到的权重设一个期望。

这上面只是一个简单的概括,对于我们做优化的人来说,网站迟迟没有被收录,需要很多的原因去让我们找。

网站迟迟不被收录的注意事项

第一条我们先了解一下CDN问题

CDN的全称是Content Delivery Network,即内容分发网络。CDN是构建在网络之上的内容分发网络,依靠部署在各地的边缘服务器,通过中心平台的负载均衡、内容分发、调度等功能模块,使用户就近获取所需内容,降低网络拥塞,提高用户访问响应速度和命中率。CDN的关键技术主要有内容存储和分发技术。

CDN简单来说就是一个用来给你网站做缓存镜像的服务器,它在全国有很多的节点,用来提高你网站的访问速度的。

那么我们知道了CDN的工作原理就不难理解,当用户访问了你的域名过后,首先会解析到你的cdn服务器调用缓存文件,然后才是回源到你的服务器上。如果cdn上设置有问题,百度蜘蛛是抓取不到你网站的内容的,所以这点来说就已经足够重要。

网站迟迟不被收录的注意事项

第二条我们了解一下robots协议

Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”(Robots Exclusion Protocol),网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。

robots.txt文件是一个文本文件,使用任何一个常见的文本编辑器,比如Windows系统自带的Notepad,就可以创建和编辑它 [1] 。robots.txt是一个协议,而不是一个命令。robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。

robots了解之后,我们再说后面的,应该有许多小伙伴在优化的时候,都见过首页收录有这么一句“由于该网站的robots.txt文件存在限制指令,系统无法提供该页面的内容描述”的提示,这是由于网站robots文件屏蔽操作导致的。所以不管你的文章内容质量怎么高,你不去修改,最终也是无法收录的原因。

原文地址:

https://www.wdw99.com/yingxiaozixun/seo/136.html

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190212A05V3G00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券