腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Python
请求
Cookie
问题
(
Web
抓取
)
、
、
、
、
我目前正在编写一个
web
抓取
器,它为我的
Python
Flask服务器提供数据。我的目标是向服务器发送POST
请求
并检索JSON。不久前,服务器添加了cookies验证,这意味着我必须使用cookies发送POST
请求
。不匹配(你可以用相同的代码尝试它);如果我随后在Mac上访问该网站,通过正常的方式手动获取发送
请求
的
cookie
字符串,并将其替换为
Python
代码,它现在可以在Mac上运行。但是,这需要我实际打开浏览器,转到url,单击一个按钮发送P
浏览 13
提问于2020-09-14
得票数 0
回答已采纳
2
回答
在
python
中伪造
cookie
来
抓取
站点
、
、
我正在尝试
抓取
的站点使用js来创建
cookie
。我想的是,我可以用
python
创建一个
cookie
,然后使用这个
cookie
来
抓取
站点。然而,我不知道有什么方法可以做到这一点。有谁有什么想法吗?
浏览 2
提问于2009-07-13
得票数 2
回答已采纳
1
回答
如何使用
python
通过oauth登录第三方app
、
、
我在对google提供的Oauth的
web
服务进行身份验证时遇到了
问题
。基本上,我想用我的google帐户登录到一个网页,在上面做一些
抓取
。由于
web
服务不是我的,所以我没有应用程序secret_key,只有clientID、redirect_URL和scope,我可以通过查看登录时使用的
请求
方法的参数来恢复它们。一旦通过身份验证,该网页只需要一个名为SID (我猜是会话ID )的
cookie
,就可以作为一个经过身份验证的用户进行应答。没有不记名令牌,只有SID
cookie</
浏览 18
提问于2021-11-26
得票数 0
1
回答
Web
Worker缺少获取响应标头
、
、
、
我正在使用
web
worker从一个chrome扩展的网站上
抓取
响应头
cookie
。当
请求
在主线程上执行时,
请求
的响应与预期一致,并且存在来自
请求
的
cookie
。但是,当在
web
worker脚本上执行完全相同的
请求
时,响应头大部分都会丢失。下面是两个回复
浏览 4
提问于2021-07-01
得票数 0
2
回答
用JQuery还是
Python
抓取
?
、
、
因此,假设我在一个网站上
抓取
多个页面(比方说1000)。我想知道哪种语言最适合用来
抓取
这些页面- javascript还是
python
。此外,我听说过javascript
抓取
器更快(由于多个get
请求
),但我不确定如何实现这一点-有人能告诉我吗? 谢谢!
浏览 1
提问于2012-03-04
得票数 0
回答已采纳
1
回答
如何处理
python
抓取
网站时的动态
cookie
?
、
、
、
、
我是
Python
的初学者。我试着从我的控制台上
抓取
一些产品信息。当我来到访问者详细信息页面时,我发现每次单击搜索按钮时
cookie
都会发生变化。我发现每个
请求
的
cookie
都会发生变化。我不能像从其他页面
抓取
数据那样
抓取
数据,这些页面的
cookie
在一定时间内是固定的。 在比较
cookie
数据后,我发现这里只有3个键值对发生了变化。我认为这3个值导致我无法
抓取
数据。
浏览 1
提问于2020-09-01
得票数 0
1
回答
python
-
请求
不获取JSESSIONID和SessionData
cookie
。
、
、
、
、
在从浏览器下载时,我发现JSTOR在两个名为JSESSIONID和SessionData的
cookie
中节省了我的接受量,但是
python
--
请求
没有
抓取
这两个
cookie
(它获取另外两个
cookie
,UserAgent().random}) return session 请注意,我之前几次使用
python
<e
浏览 2
提问于2015-06-16
得票数 0
回答已采纳
1
回答
如何以编程方式使用浏览器
cookie
、
、
、
、
我有一个自动登录和
抓取
网站的爬虫,但由于登录被更改,它不再工作。如果它可以工作,我如何获得“原始”
cookie
字符串,我可以坚持到我的HTTP
请求
? 我是这个领域的新手,所以请原谅我那些愚蠢的
问题
。我可以使用
PYthon
或Java
浏览 4
提问于2012-11-29
得票数 0
回答已采纳
2
回答
抓取
一个要求他们先给你会话
cookie
的网页
、
、
、
我正试着从一个政府的“集合名单”数据库中
抓取
一个excel文件。但是,我必须访问此excel文件的URL: 要求我将来自政府网站的会话
cookie
附加到
请求
。我如何
抓取
初始
请求
到登录页面的会话
cookie
(当他们给你会话
cookie
时),然后用它点击上面的URL来
抓取
我们的excel文件?我在使用
Python
的Google App Engine上。=HouseholdInf_engRH&hhid=1924203170260
浏览 7
提问于2012-03-18
得票数 5
回答已采纳
1
回答
Web
抓取
:使用
cookie
发出POST
请求
、
在向他们的时间表JSON文件发出POST
请求
之前,我需要检索/刷新
cookie
,否则我会得到一个会话ID错误。`sessionID: none` and 'errorCode': '620', 'errorDescription': 'Invalid Session Number' 这是我的
请求
: url =
浏览 21
提问于2020-03-18
得票数 0
1
回答
使用
Python
进行
Web
抓取
、
、
我正在尝试使用urllib2和BeautifulSoup来
抓取
网站的urllib2。不幸的是,当我试图通过
Python
访问页面时,我一直被禁止使用403。我认为这是一个用户代理
问题
,但改变它没有帮助。然后我想这可能与
cookie
有关,但是很明显,通过关闭
cookie
的链接加载页面很好。通过urllib阻塞
请求
的可能是什么?
浏览 4
提问于2011-08-06
得票数 2
1
回答
如何管理在后台填充的cookies
我应该加载检查我们的
web
应用程序。当第一次
请求
到来时,应用程序会验证浏览器并为
cookie
设置一个browserid。我无法设置此值,因为我收到会话超时消息。有没有办法解决这个
问题
?
cookie
是在action类中设置的,所以我想
抓取
不是一个解决方案。有人能帮上忙吗?
浏览 6
提问于2011-07-11
得票数 2
回答已采纳
1
回答
如何手动将更多cookies添加到已在mechanize中设置了cookies的会话中?
、
、
我有一个
python
脚本,它
抓取
页面并接收
cookie
。我想将另一个
cookie
附加到正在发送到服务器的现有
cookie
。因此,在下一次
请求
时,我将获得原始页面中的
cookie
以及我手动设置的
cookie
。 不管怎么说,做这件事吗?我尝试在mechanize中添加头文件,但是被忽略了。
浏览 1
提问于2010-08-30
得票数 6
回答已采纳
2
回答
Python
使用会话
Cookie
抓取
Web
、
、
、
嗨,我正在试着从这个URL中删除一些数据:正如您可能已经注意到的,如果
cookie
和会话数据尚未设置快速检查会发现网站正在设置会话ID (PHPSESSID),并复制到客户端的
cookie
中。 Getting page https://pypi.
pyt
浏览 1
提问于2013-09-19
得票数 1
2
回答
Python
请求
-
web
抓取
、
、
因此,我试图访问一些数据,以进行网络
抓取
。然而,当我到达从这个中提取一个图形的时候,我被卡住了,在这里我想编辑下面代码中观察到的数据时间段。关于一些额外的信息,我尝试访问chrome中的网络选项卡,通过post
请求
来更改它,但是每次我都被拒绝访问。class=""> </li></div> 我可以通过Network看到有一个包含以下数据
浏览 1
提问于2020-07-14
得票数 0
回答已采纳
1
回答
使用
Python
单击Download按钮下载文件
、
、
、
我想下载一个文件,其中没有使用机械的网址。我尝试了.read(),但它给我的是html文件,这是显而易见的。这是我需要发送to> file>访问列表并单击create http://www.ncbi.nlm.nih.gov/sra?term=SRP000714的url文件。
浏览 2
提问于2014-09-11
得票数 2
2
回答
接受
cookie
的同时
抓取
页面的
请求
和漂亮的汤
、
、
、
问题
是一些网站使用cookies,你必须点击接受cookies才能看到价格。如何在
web
抓取
时接受cookies?
浏览 1
提问于2020-12-07
得票数 0
2
回答
使用
python
从网页中提取Disqus评论,声誉和点赞?
、
、
我正在试图找出一种方法来提取评论,作者的声誉和喜欢使用
python
。有人能帮上忙吗?
浏览 1
提问于2013-11-21
得票数 2
2
回答
使用
Python
请求
发送
Cookie
、
、
、
我正在尝试使用
Python
请求
库来
抓取
一些数据(重现我在浏览器中执行的POST操作)。期望它会通过复制request header和post form来返回我在使用浏览器时看到的内容。但是,我不太确定使用
Python
请求
发送
cookie
的正确方式是什么。这是它在Chrome中的屏幕截图。 看起来我既可以在
请求
头中使用
cookie
作为键,也可以在post命令中使用
cookie
参数。如果我想在
请求
头中使用
cook
浏览 0
提问于2014-10-22
得票数 0
回答已采纳
1
回答
在R中
抓取
网页是不可能的,403禁止错误是
、
、
我正在尝试
抓取
这个网页: 我尝试过用
Python
语言( 、等)提供的几个推荐。从堆栈溢出的
问题
,但它不可能获得状态代码200。
浏览 0
提问于2019-12-07
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券