首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >urllib2有时会返回旧页面-返回奇怪的标头

urllib2有时会返回旧页面-返回奇怪的标头
EN

Stack Overflow用户
提问于 2015-09-04 01:18:08
回答 1查看 89关注 0票数 0

我正在开发一个python脚本,它使用URL返回的JSON。几天后,urllib2会(只是有时)返回JSON的旧状态。我确实添加了标题"Cache-Control":"max-age=0“等,但有时还是会发生这种情况。

如果我打印出我得到的请求信息:

代码语言:javascript
运行
复制
Server: nginx/1.8.0
Date: Thu, 03 Sep 2015 17:02:47 GMT
Content-Type: application/json; charset=utf-8
Content-Length: 3539
Status: 200 OK
X-XHR-Current-Location: /shop/169464.json
X-UA-Compatible: IE=Edge,chrome=1
ETag: "b1fbe7a01e0832025a3afce23fc2ab56"
X-Request-Id: 4cc0d399f943ad09a903f18a6ce1c488
X-Runtime: 0.123033
X-Rack-Cache: miss
Accept-Ranges: bytes
X-Varnish: 1707606900 1707225496
Age: 2860
Via: 1.1 varnish
Cache-Control: private, max-age=0, must-revalidate
Pragma: no-cache
X-Cache: HIT
X-Cache: MISS from adsl
X-Cache-Lookup: MISS from adsl:21261
Connection: close

是否与标题"Age“或"X-Cache-Rack”有关?或者有什么办法可以修复它吗?

提前感谢!

EN

回答 1

Stack Overflow用户

发布于 2015-09-04 01:24:52

尝试伪造用户代理,删除cookie,删除会话。

代码语言:javascript
运行
复制
fake_user_agent = ['chrome','firefox','safari']
request = urllib2.Request(url)
request.add_header('User-Agent', get_random(fake_user_agent))
content = urllib2.build_opener().open(request)

如果全部都不起作用,那么尝试使用tor更改每个请求的ip。

如果什么都不能工作,那么你就不能绕过它,因为你肯定是在连接透明代理

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32381831

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档