我们如何编写.htaccess来阻止Googlebot UA访问以正斜杠结尾的URL,后跟4-6位数字?
我们浪费了大量的Googlebot抓取预算,因为它抓取的是“无索引”页面。
计划是使用.htaccess阻止UA访问以正斜杠结尾的URL,后跟4-6个数字。
例如:
https://example.com/folder/folder/12563
https://example.com/folder/folder/125637
https://example.com/folder/folder/1563我认为REGEX看起来像这样:
\/\d{4,6}$但是我如何配置.htaccesss,并且只针对特定的UA (googlebot)?
谢谢!
发布于 2019-02-06 00:54:40
您可以使用以下命令:
RewriteEngine on
RewriteCond ℅{HTTP_USER_AGENT} googlebot [NC]
RewriteRule /\d{4,6}$ - [F,L]如果googlebot试图访问您服务器上的受限URL,这将返回一个Forbidden HTTP 403 error。
https://stackoverflow.com/questions/54538146
复制相似问题