问使用Scrapy下载PDF文件
EN

Stack Overflow用户

提问于 2011-11-13 07:54:27

回答 1查看 1.7K关注 0票数 0

我正在使用一个Python web抓取框架Scrapy从一个网站抓取pdf文件。

网站需要遵循相同的会话，才能允许您下载pdf。

它在Scrapy上工作得很好，因为它是自动的，但当我在几秒钟后运行脚本时，它开始给我假的pdf文件，就像我试图在没有会话的情况下直接访问pdf一样。

为什么会这样&你知道如何克服这个问题吗？

发布于 2011-11-14 02:50:06

我想这个网站会跟踪你的会话。如果是PHP站点，则将PHPSESSID cookie传递给下载PDF文件的请求。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/8108477

复制

相似问题

问使用Scrapy下载PDF文件EN