首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >是否有一种以编程方式强制爬虫不索引特定图像的方法?

是否有一种以编程方式强制爬虫不索引特定图像的方法?
EN

Stack Overflow用户
提问于 2017-09-18 08:58:43
回答 1查看 68关注 0票数 0

我想阻止爬虫索引特定的图片在我的网站上,但只有当他们是年龄超过一个特定的日期。但是,爬虫不应停止索引当前链接图像的页面。

我最初的方法是编写一个脚本,它将图像的URL添加到'robots.txt',但是我认为文件会变得很大,因为我们谈论了大量的潜在图像。

我的下一个想法是使用<meta name="robots" content="noimageindex">标记,但我认为这种方法很容易出错,因为我可以忘记将这个标记添加到模板中,在模板中我可能希望阻止爬虫对图像进行索引。这也是多余的,爬虫将忽略所有的图像。

我的问题是:如果某个条件(在我的例子中是日期)是正确的,那么您知道以编程方式强迫爬虫不要索引图像吗?还是我唯一可能阻止爬虫索引整个页面?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-09-18 09:04:57

在考虑的基础上,您可以创建一个单独的位置来保存不希望被索引的图像,编写一个脚本,在文件“过期”后将文件移动到该位置,然后将url添加到robots.txt文件中。也许有点像/expired_images*

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/46275319

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档