首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >雅虎网站刮擦:限制是什么?

雅虎网站刮擦:限制是什么?
EN

Stack Overflow用户
提问于 2010-04-21 07:27:04
回答 2查看 716关注 0票数 0

我们正在使用一个网络刮板,并将其设置为具有随机功能的睡眠功能(这样每一次抓取之间的时间不同),但在20-30个请求之后,我们仍然被雅虎阻止。

有没有人知道是否有一个限制(即:每分钟20个请求,每小时200个请求),现在我们每个请求之间的平均间隔大约是3-6秒。谢谢你的帮助

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2010-04-22 07:50:53

所以答案是5000个查询。摘自

http://forums.digitalpoint.com/showthread.php?t=736784

http:// developer。雅虎。com/search/rate.html

票数 0
EN

Stack Overflow用户

发布于 2010-04-21 14:10:02

每3-6秒一个请求是相当低的,所以也许你的爬虫有另一个问题。

以下是一些想法:

如果您当前的IP是blacklisted

  • try

,请将用户代理设置为与Referer标头相同的域,并尝试从不同的IP运行crawler

如果使用像Mechanize这样的更高级别的库,这一切都会变得更容易。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/2679396

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档