文章/答案/技术大牛

发布

社区首页 >问答首页 >返回相同URL的200和300的Googlebot

问返回相同URL的200和300的Googlebot
EN

Webmasters Stack Exchange用户

提问于 2021-12-01 16:05:27

回答 1查看 91关注 0票数 1

为什么我们网站上的URL有时会返回200，有时还会返回301？这似乎发生在我们的一些URL上，甚至是一些基本的URL，比如example.com/robots.txt。

当我自己加载URL时-它总是返回一个200

该站点被配置为www.example.com/robot.txt --是否是机器人正在查看非www版本并被重定向？

301-redirect

googlebot

回答 1

Webmasters Stack Exchange用户

发布于 2021-12-02 05:14:02

对不起，我们在评论中有答案的案例。必须改正。

当访问日志显示“相同”URL的不同行为时，请确保它确实是相同的url:检查协议、子域、TLD、区域、路径和查询字符串。默认的访问日志记录模式非常糟糕，并且错过了很多维度。
Google通常不使用sitemap来爬行，当它使用时，它只是一个补充参考。主要参考资料是在网上找到的链接。所以你可以很容易地得到谷歌爬行的urls，这与站点地图中的不同。您可以使用rel规范和重定向逻辑来修正这一问题。
在这里，访问日志如何与重定向一起工作：

3.1客户端(在我们的例子中是Googlebot)将请求url (例如，带有“错误”子域或协议)发送到服务器端:80。

3.2在服务器上，在端口80上，我们有一个web服务器软件，可以监听类似的请求。它获取请求，并通过一堆逻辑运行请求，以了解如何处理它。它看到它有规则(通常在.htaccess中，但并不总是)将所有http:// url重定向到其https:// version，因此它向客户机发送一个响应，代码301和位置字段设置为url的https:// version。

3.3在将客户端发送出去后，web服务器无需等待下一次攻击，就会在其访问日志中记录显示已经发生了攻击，并对其进行了处理。在此之后，网络服务器永远忘记了那个客户端。

3.4客户机从服务器获得响应，然后有机地向接收到的响应的位置发出另一个请求，从而向页的https://版本发出请求。

3.5 web服务器获得另一个请求，并将其视为从来没有原始请求:它经过一串逻辑，并看到这种请求模式必须分配给php以获得响应，因此它将请求(和cookie)交给php端点，而php返回一个主体来响应客户端。web服务器响应客户端并在访问日志中创建另一条记录。

因此，在301命中之后，您几乎总是会在日志中得到另一个命中。

这里我忽略了许多细微之处，比如CDN、SSL/TLS握手、http2握手，但这只是为了给web服务器日志如何工作提供非常基本的理解。

票数 1

页面原文内容由Webmasters Stack Exchange提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://webmasters.stackexchange.com/questions/137740

复制

相似问题

问返回相同URL的200和300的Googlebot
EN

回答 1

Webmasters Stack Exchange用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问返回相同URL的200和300的GooglebotEN

回答 1

Webmasters Stack Exchange用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问返回相同URL的200和300的Googlebot
EN