专栏首页张戈的专栏SEO分享:让百度删除不想收录的域名或快照的最快方法

SEO分享:让百度删除不想收录的域名或快照的最快方法

个别网站可能会出现以下类似困扰:

①、百度收录了自己不想收录的域名,造成内容重复,比如张戈博客,百度近一半的收录是 www 的域名,而且收录的内容还是重复的!实际上张戈博客的首选域名是不带 www,就算一开始就做了 301,也被百度无视了;

②、网站中途才设置的伪静态,收录正常后发现依然存在旧的动态链接,想删除之;

③、百度收录了虚拟主机自带的三级域名,想删除之;

④、网站改版,如精简分类数量、修改分类名称,造成了 url 死链,想删除之;

先具体说一下张戈博客是如何解决第①个困扰的:

前些天分享的《彻底禁止搜索引擎收录非首选域名的方法》,实际上仅适合新站设置,而我这种中途做禁止设置的网站,只会收到来自百度的 robots 禁封提醒,而不会删除之前的收录:

那我该如何彻底删除这些重复收录呢?

方法很简单,利用百度站长平台的闭站保护功能即可。经多次尝试,张戈博客 www 域名重复收录终于全部清空了!

下面说下具体方法:

一、去掉 robots 限制

如果之前对该域名做过 robots 禁封的话,需要先解除限制,删除 robots 即可。因为,你都不让百度抓取了,百度当然不知道你这些链接还能不能用,该不该删?他只会认为你是粗心误操作了 robots 而已。

二、设置 404 状态

经测试,百度的闭站功能申请通过的前提条件是,所有链接必须是 404 死链状态,否则无法通过:

所以,我们先对那些已收录的非首选域名,设置 404 返回码,即死链状态,如果之前设置了 301,记得要取消掉!

①、Nginx

如下修改之前非首选域名的监听设置:

server
         {
                server_name www.zhangge.net;
                root  /home/wwwroot/zhangge.net;
                location / {
                        #全部返回404
                        return 404;
                        }
}

 ②、PHP 通用

将以下代码添加到网站的 head 部分

<?php if($_SERVER['HTTP_HOST'] == 'www.zhangge.net') { ?>
header('HTTP/1.1 404 Not Found');
header("status: 404 Not Found");
<?php } ?>

 ③、ASP 通用

同样的将以下代码添加到网站 head 部分(注意是动态模板,而不是静态页)

<% 
   if Request.ServerVariables("SERVER_NAME")="www.zhangge.net" then 
   Response.Status = "404 Not Found"  
   end if
%>

设置完成后,记得手动访问测试下效果。

三、闭站申请

404 确认无误之后,打开百度站长平台的抓取频率,选择闭站保护

http://zhanzhang.baidu.com/pressure/close

然后,选择你要关闭的非首选域名,比如 www.zhangge.net,最后在下方继续勾选 www.zhangge.net,提交即可!切记不要提交带星号(*)的选项,那是指所有相关域名!

大概 2 天左右,就收到了闭站申请通过的通知:

可以看到,张戈前后测试了 3 次,前 2 次测试提交时,采用的是 403 或者是仅针对搜索引擎的 404 设置,结果都没通过!看来,闭站保护是采用人工审核的,而非机器!

Ps:闭站是对整个域名删除的最快方法,但如果是删除部分收录,那就得使用百度站长平台的死链提交功能。

四、补刀设置

现在再去 site 非首选域名,发现已全部删除干净:

我的目的已经达到!为了保持用户体验,现在需要恢复之前的 301 跳转和 robots 禁封设置:

参考之前写的的《彻底禁止搜索引擎收录非首选域名的方法》,重新设置了 robots 禁止收录和 301 跳转。现在,只要我不去申请闭站恢复,我相信百度再也不会收录 www 域名了!

五、写在最后

看完针对困扰①的解决办法,相信其他困扰也可以依葫芦画瓢的做好相应处理。

原理很简单,你想要删除哪个快照或域名,只需要将这些对象设置为 404 死链状态,然后去百度站长平台做死链提交即可,一般 2~3 天就能立竿见影。至于,如何设置 404 死链状态,则需要对症下药,方法不尽相同,张戈就不赘述了。当然,你有任何需要都可以去留言板留言告知。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 申请域名邮箱,为空间减轻压力

    玛思阁换空间之后,空间后台已配备邮箱管理(以前的那个 Win 主机,邮箱都没有,让我一直用的 QQ 邮箱!),由于个人邮箱好几个,于是就想都弄到一起,集中看邮件...

    张戈
  • 替换WordPress默认搜索为百度站内搜索(知更鸟主题可照搬)

    今天,中国博客联盟 QQ 群里的【58 说】博友提到百度站长平台推出绿色收录通道了。连忙登陆站长平台看了下,意外的发现张戈博客已开通了站内搜索功能。之前确实给管...

    张戈
  • 解决网站404页面返回200状态码问题

    好久没打理博客,突然收到 CDN 流量预警,发现平均每天 40G 流量消耗!what?就现在这个访问量,不存在的。看了下 CDN 日志发现有小人一直在请求博客页...

    张戈
  • 基于 Seata Saga 设计更有弹性的金融应用

    Seata 意为:Simple Extensible Autonomous Transaction Architecture,是一套一站式分布式事务解决方案,提...

    用户5397975
  • LeanCloud云引擎相关问题

    听着music睡
  • 在ubuntu16.04上安装owncloud

    cn華少
  • ​[JDK] HashMap 原理总算整明白了

    哈希表(hash table)也叫散列表,是一种非常重要的数据结构,应用场景及其丰富,许多缓存技术(比如memcached)的核心其实就是在内存中维护一张大的哈...

    架构探险之道
  • Entity Framework——并发策略

    使用EF框架遇到并发时,一般采取乐观并发控制。 1支持并发检验 为支持并发检验,需要对实体进行额外的设置。默认情况下是不支持并发检验的。有以下两种方式: ...

    甜橙很酸
  • SqlHelper中SqlHelperParameterCache类的用法介绍

    SqlHelper类中提供了三种可以用来管理SqlParameter参数的共享方法。下面来一一讲解: 1、CacheParameterSet 将SqlParam...

    郑小超.
  • App为什么会crash?一篇文章带你探究根本原因 ,事情没有你想得那么简单!

    看到这个问题,马上就可以回答出来:因为抛出异常就会 crash。 那么为什么抛出异常就会 crash 呢? 有没有办法不让 App crash 呢? 接下来我们...

    Android技术干货分享

扫码关注云+社区

领取腾讯云代金券