我最近经历了很高的RPM峰值。就像这样:
当我调试时,我发现有理由相信,原因是msnbot突然进行了大规模的爬行,然后停止了。我想我不是唯一一个突然处理5倍于常规RPM的站点,那么msnbot为什么要这样做呢?是否有任何有效的解释或技术理由来执行这样的攻击和逃逸?
发布于 2013-08-17 16:25:32
msnbot
是2010年活跃网络爬行的退休,被bingbot
取代--这就是你的意思吗?
无论如何,作为涵盖的这里,影响爬行率的因素是:
考虑到上述因素,可能有助于解释每分钟请求中的尖峰。
若要减慢爬行速度,请在站点的robots.txt中指定:
User-agent: msnbot
Crawl-delay: 1
如果确定是机器人/用户代理导致尖峰,则将msnbot
更改为bingbot
。如果服务器的性能受到影响,则使用5(非常慢)或10 (非常慢)的crawl-delay
。
https://webmasters.stackexchange.com/questions/51893
复制相似问题