Scrapy FormRequest不执行post请求_使用scrapy.FormRequest的POST请求_Scrapy - FormRequest在方法为POST时发送GET请求 - 腾讯云开发者社区

python、authentication、web-scraping、scrapy

登录(沃尔玛)在使用FormRequest.from_response()时返回412错误。 412描述了前提条件中的一些错误，因此我尝试手动传递所有标头。没有起作用。我也试过传递曲奇，还是不起作用。上述网站有表单，但它将它的值传递给它的登录API，所以我尝试使用postman向API的url发出POST请求，它确实起作用了，将想法转移到Scrapy，没有起作用，而且，使它违背了刮板的目的，在登录时使用网站的功能，因为它可能不会重定向到网站。 def parse(self, response): cookie = response.headers.getlist('S

浏览 235提问于2019-10-16得票数 0

2回答

重复的请求发布到scrapy FormRequest

python、scrapy、python-requests

我正在尝试学习如何在网站上抓取FormRequest的工作方式，我有以下抓取代码： import scrapy import json from scrapy.utils.response import open_in_browser class Test(scrapy.Spider): name = 'go2' def start_requests(self): url = 'http://www.webscrapingfordatascience.com/jsonajax/results2.php' payl

浏览 1提问于2019-08-12得票数 3

1回答

Scrapy FormRequest.from_response()方法

python、scrapy

Im正在尝试使用Scrapy解析页面，为了显示隐藏的文本和价格，我在字段中输入了任意的邮政编码或随机数字： <input aria-label="Enter your zip code" role="textbox" name="searchTerm" class="form-control js-list-zip-entry-input" placeholder="ZIP Code" autocompletetype="find-a-store-search" tabindex="-

浏览 0提问于2016-11-30得票数 3

1回答

刮伤型FormRequest

python、scrapy、http-post、infinite-scroll

我对刮伤的FormRequest有困难。我试图从这个页面获得所有评论(无限滚动)：当我滚动时，我可以看到一个带有数据表单的post请求：{xyz":"3"} 但是，当我尝试使用scrapy命令行时，我无法得到正确的响应。 from scrapy import FormRequest fetch("https://www.temporel-voyance.com/voyance/planning/consultations-voyants-en-privee/angele/1041") req = FormRequest(response.url, fo

浏览 1提问于2018-10-20得票数 1

回答已采纳

1回答

Scrapy FormRequest不执行post请求

scrapy

我不想这样 return [FormRequest.from_response(response, 因为登录表单没有<form>标记所以我试着： return scrapy.FormRequest(url="...", formdata={}, callback=self.after_post) return [FormRequest(url="...", formdata={}, c

浏览 23提问于2020-04-07得票数 0

1回答

FormRequest爬行时的抓取麻烦

python、scrapy

我正试图从中检索信息。为此，我需要登录，但我不能。我将我的用户放在Google Chrome的检查工具中，传递和搜索一个具有请求方法的页面: POST，如下所示：。因此，使用以下代码： from scrapy.item import Item, Field from scrapy.http import FormRequest from scrapy.spider import Spider from scrapy.utils.response import open_in_browser from scrapy import Request class AliceWeb2(Sp

浏览 0提问于2017-12-19得票数 0

回答已采纳

1回答

使用Scrapy在搜索字段中输入字符串；加载生成的URL

scrapy、web-crawler、search-box

在这个网站的输入框中自动输入邮政编码值"27517“的正确方法是：是使用表单请求吗？我现在要说的是： import scrapy from scrapy.http import FormRequest from scrapy.item import Item, Field from scrapy.http import FormRequest from scrapy.spider import BaseSpider class LkqSpider(scrapy.Spider): name = "lkq" allowed_domains = ["http://

浏览 1提问于2016-05-20得票数 0

回答已采纳

2回答

无法使用刮伤认证fandromeda

authentication、scrapy、http-post

我刚开始刮刮网站上的一些数据，但我需要先进行身份验证，然后才能开始抓取所需的数据，如下所示我正在尝试使用from_response方法来尝试登录到站点。 import scrapy from scrapy.spiders import CrawlSpider from scrapy.http import Request, FormRequest from scrapy.selector import Selector from fandromeda.items import FandromedaItem class FandromedaC(CrawlSpider): name

浏览 4提问于2016-12-01得票数 0

回答已采纳

1回答

使用FormRequest.from_response将pdf文件抓取到特定格式(Id)

python、scrapy

我正在尝试将pdf文件上传到一个网站(Flask服务器)，其中表单ids是文件名例如一个id = 1的表单，所以我需要将'arquivos/1.pdf‘上传到它，我尝试使用scrapy.FormRequest.from_response，但是当我尝试将scrapy.FormRequest.from_response作为内容类型头添加时，服务器不会找到或接收该文件。 <title>Upload 1 new File</title> <h1>Upload 1 new File</h1> <form id=1 actio

浏览 1提问于2018-12-01得票数 1

2回答

使用Splash将Scrapy发布到Javascript生成的表单

python、web-scraping、scrapy、splash-screen、scrapyjs

我有下面的蜘蛛，它应该是用来发布到表单中的。不过，我似乎没办法让它起作用。当我通过Scrapy做这件事的时候，我的反应从来没有显示出来。有人能告诉我我哪里出了问题吗？这是我的蜘蛛密码： # -*- coding: utf-8 -*- from __future__ import unicode_literals import scrapy from scrapy.http import FormRequest from scrapy.shell import inspect_response class RajasthanSpider(scrapy.Spider): name =

浏览 8提问于2016-03-13得票数 1

回答已采纳

2回答

将链接请求合并为一个

python、scrapy、scrapy-spider

我有一个场景，我正在浏览一家商店，浏览10页。然后当我找到我想要的物品时，我会把它加到篮子里。最后，我想检查一下篮子。问题是，使用刮伤链，它想要检查篮子的次数，就像我在篮子里有项目一样。如何将链接的请求合并为一个，因此在向篮中添加10个项之后，签出只被调用一次？ def start_requests(self): params = getShopList() for param in params: yield scrapy.FormRequest('https://foo.bar/shop', callback=self.addToBask

浏览 2提问于2018-06-11得票数 0

回答已采纳

1回答

如何在scrapy中执行请求postrequest

python、post、scrapy、scrapy-spider

我想从一个post请求开始我的抓取爬虫 import requests data = { 'lang': 'en', 'limit': '10', 'offset': '0', 'path': '/content/swisscom/en/about/news', 'query': '' } s_url = 'https://www.

浏览 0提问于2018-10-11得票数 0

1回答

Python Scrapy -需要一个用于使用AJAX调用进行分页的FormRequest的修复-有点迷失在这里

python、python-3.x、ajax、scrapy

import scrapy from lxml.html import fromstring from ..items import PontsItems from scrapy.http import FormRequest class Names(scrapy.Spider): name = 'enseafr' download_delay = 5.0 current_page = 1 def start_requests(self): my_url = 'https://www.ponts.org/annu

浏览 0提问于2020-09-16得票数 0

1回答

刮伤不能提交表格

python、html、scrapy、web-crawler

这是我想刮的网页：。我想模拟提交表单#resultDisplayOptionsForm，并将#customDisplayNum设置为All，这将为我带来一个包含所有列出项的网页。这是我的代码片段： def parse(self, response): yield scrapy.FormRequest.from_response( response, formid='resultDisplayOptionsForm', formdata={'displayNum': '100000'}, #

浏览 1提问于2017-08-31得票数 2

回答已采纳

3回答

在scrapy请求中放置python请求的数据属性的位置

python、scrapy、python-requests

我有一个包含数据的python请求，我必须用一个scrapy请求来替换它，但是我无法找到一种方法，将这些数据放在scrapy请求中的位置。 data = '{"username":"xyz@gmail.com","password":"123"}' response = requests.post('https://my.matterport.com/api/v2/user/login/', data=data) 我应该把数据放在什么地方？ Request('https://my.matt

浏览 3提问于2019-09-17得票数 0

1回答

如何使用scrapy触发JS ASP.Net下一页事件？

javascript、asp.net、scrapy、dom-events

我正在从这个中删除内容，我首先发送一个FormRequest，该FormRequest根据在另一个问题上的答案生成搜索结果我刮什么是需要的，并希望移动到下一页，不包括一个网址，它是由JS触发的。下面是html标记的样子： <a href="javascript:__doPostBack('dgSearchResults$ctl24$ctl01','')">2</a> 我尝试了以下几种方法，但似乎没有什么效果： In [18]: fr = FormRequest.from_response(response, formda

浏览 0提问于2020-08-24得票数 2

回答已采纳

1回答

张贴请求与刮刮不正确地重定向？

python、python-3.x、scrapy、scrapy-shell

我正在尝试使用scrapy从中提取一些数据。我有一些地址，我想从网站中提取与每个地址相关联的信息，所以我需要通过这个urls “按地址搜索”。我试着用8433作为街道号，LAKEVIEW作为街道名，站点将我重定向到这个网址：，这是我想要的。但是，正如您所看到的，我用于搜索的信息并不在结果的url中。我和检验员核对了这一页，得到了这样的信息：因此，我使用scrapy完成了一个post请求，并传递了如下参数： >>> from scrapy.http import FormRequest >>> form_data = {"Situs_St

浏览 1提问于2017-02-16得票数 0

回答已采纳

1回答

响应对象是如何通过刮取刮板中的请求回调传递的？

python、scrapy、scraper

我的代码包含在下面，实际上它只不过是稍微修改过的版本。代码的工作方式是-原样，但是我在登录和请求是如何通过后续请求之间的逻辑上有一个空白。根据文档，请求对象返回响应对象。此响应对象作为回调函数的第一个参数传递。我明白了。这是使用用户凭据处理身份验证和后续请求的方式。我不理解的是响应对象是如何在身份验证之后对下一个请求调用进行响应的。在下面的代码中，解析方法返回使用FormRequest方法进行身份验证时创建的结果对象。因为FormRequest有一个对after_login方法的回调，所以调用after_login方法时，来自FormRequest的响应作为第一个参数。 after_log

浏览 3提问于2014-01-05得票数 1

回答已采纳

2回答

使用刮伤登录不工作

python、web-scraping、scrapy、scrapy-spider

我已经为登录到一个站点编写了刮伤代码。首先，我尝试了一个网站。效果很好。但后来我换了网址，想找别的网站。它不适用于那个网站。我使用了相同的代码，没有任何改变。会有什么问题？ # -*- coding: utf-8 -*- import scrapy from scrapy.http import FormRequest from scrapy.utils.response import open_in_browser class QuoteSpider(scrapy.Spider): name = 'Quote' allowed_domains

浏览 6提问于2017-11-13得票数 0

回答已采纳

1回答

刮擦填写邮寄表格

javascript、python、post、scrapy

我正试着用刮擦来填一张邮寄表，试着订火车票。我认为FormRequest类可以完成这个任务，但是我不能处理javascript表单。刮痕爬虫什么也不回。我使用的文件足以发送表单。 import scrapy from scrapy.item import Item, Field from scrapy.http import FormRequest from scrapy.spider import BaseSpider class SncfItem(Item): title = Field() link = Field() desc = Field() class SncfS

浏览 1提问于2015-06-02得票数 2

回答已采纳

1回答

在引用url时调用Scrapy - POST请求，而不是初始请求。

python、scrapy、web-crawler

我正在提交一个FormRequest来更改多个结果页面的页数。当我使用scrapy时，Post请求会通过： > `2017-05-21 22:44:19 [scrapy.core.engine] INFO: Spider opened > 2017-05-21 22:44:20 [scrapy.core.engine] DEBUG: Crawled (200) <GET > http://www.australianschoolsdirectory.com.au/robots.txt> (referer: > None) 2017-05-21 22:44:

浏览 3提问于2017-05-21得票数 1

回答已采纳

2回答

等待Scapy回调函数

python、asynchronous、callback、scrapy

我对一般的Scrapy和Python都很陌生。以下是代码： import scrapy import json class MOOCSpider(scrapy.Spider): name = 'mooc' start_urls = ['https://www.plurk.com/search?q=italy'] custom_settings = { 'DUPEFILTER_CLASS': 'scrapy.dupefilters.BaseDupeFilter', } gl

浏览 3提问于2020-12-03得票数 1

回答已采纳

1回答

在scrapy shell中呈现JS内容的FormRequest

scrapy、dynamic-content

我正在尝试从这个page中抓取以下表单数据的内容：我需要将County:设置为George's，并将DateOfFilingFrom设置为01-01-2000，因此我执行以下操作： % scrapy shell In [1]: from scrapy.http import FormRequest In [2

浏览 24提问于2020-08-24得票数 1

回答已采纳

2回答

调试由FormRequest.from_response发送的标头

python、web-scraping、scrapy

Scrapy有很好的调试功能。但是我找不到方法来调试FormRequest.from_response发送的头部、get、post参数有没有办法，让我看看那些帖子的数据？我特别关注它是否从隐藏字段发送值。

浏览 3提问于2014-06-16得票数 3

1回答

在FormRequest中使用Scrapy

python、scrapy、web-crawler、scrapy-spider

尝试用来自和的代码登录一个CMS成员站点，但是我总是很短。我的错误信息： 2017-03-20 18:18:07 [scrapy.core.engine] DEBUG: Crawled (200) <GET http://members.com/robots.txt> (referer: None) 2017-03-20 18:18:07 [scrapy.core.engine] DEBUG: Crawled (200) <GET http://members.com/wp-login.php> (referer: None) 2017-03-20 18:18:07 [

浏览 4提问于2017-03-20得票数 0

回答已采纳

1回答

如何使用scrapy获取表数据？

python、scrapy

我试图从这个中获取表数据，但是它是post方法，我试图实现刮擦代码，但是我面临着500个错误。但如果你可以检查一下网络部分，它显示200，但我得到500在刮刮时间。请检查我的代码，让我知道我在这里做什么错误。弹丸帮助。谢谢。还有一件事，用户代理已经申请。 from scrapy import Spider from scrapy.http import Request, FormRequest from scrapy.utils.response import open_in_browser class LarmSpider(Spider): name = 'larm

浏览 6提问于2020-10-28得票数 0

回答已采纳

2回答

需要JavaScript交互的抓取页面

python、scrapy、scrapy-spider

我正试着用刮刀刮。我在使用FormRequest时遇到了困难--具体来说，我不知道如何告诉Scrapy如何填充块和批次表单，然后得到页面的响应。我试着在这里找到的Scrapy网站上学习FormRequest的例子()，但是仍然很难正确点击“搜索”按钮。如果您能提供任何建议，以便我可以从提交的页面中提取数据，我将非常感激。因此，一些海报建议Scrapy不能很好地处理JS事件，而是使用另一个像CasperJS这样的库。更新:如果有人能告诉我/Python库允许我提交表单并检索后续信息，我将非常感激。更新代码(下面是Pawel的评论)：我的代码可以在这里找到： from scrapy.spid

浏览 0提问于2014-05-25得票数 1

回答已采纳

1回答

使用scrapy的FormRequest不提交任何表单

python-2.7、web-scraping、web-crawler、scrapy、scrapy-spider

在尝试了scrapy的第一个教程之后，我真的很兴奋。所以我也想试着提交表格。我有下面的脚本，如果我打印出response.body，我带着表单返回到页面，什么也没有发生。有人能帮我找到结果页面吗？ # spiders/holidaytaxi.py import scrapy from scrapy.http import Request, FormRequest from scrapy.selector import HtmlXPathSelector, Selector class HolidaytaxiSpider(scrapy.Spider): name = "ho

浏览 3提问于2015-07-05得票数 2

回答已采纳

1回答

如何在Scrapy中发出需要请求有效负载的POST请求

python、web-scraping、scrapy

我正在尝试解析来自这个的数据。在检查元素的网络部分，我找到了一个用于返回我感兴趣的JSON的POST请求的链接。但是对于这个帖子请求，有一些字典的请求有效载荷。我假设它就像普通的格式数据，我们使用它在刮刮中生成FormRequest，但是它返回403错误。我已经试过以下几种方法。 url = "https://busfor.pl/api/v1/searches" formdata = {"from_id" : d_id ,"to_id" : a_id ,"on"

浏览 3提问于2019-10-07得票数 0

回答已采纳

1回答

来自第三方API的500内部服务器错误

json、python-3.x、api、web-scraping、scrapy

Python3.6- Scrapy 1.5 我正在刮约翰迪尔保修网页，以查看所有新的PMP和它的到期日期。在浏览器和网页之间的网络通信中，我发现了一个REST，用于在网页中输入数据。现在，我试图从API中获取json数据，而不是抓取javascript页面的内容。但是，我得到了一个内部服务器错误，我不知道为什么。我用刮伤来登录和捕捉数据。 import scrapy class PmpSpider(scrapy.Spider): name = 'pmp' start_urls = ['https://jdwarrantysystem.deere.c

浏览 0提问于2018-07-05得票数 1

回答已采纳

1回答

Python Scrapy -如何在抓取特定数据之前勾选复选框和搜索

python、scrapy

我得到了这个网站https://www.ingenieurs-ensea.fr/annuaire/recherche 我需要勾选2023,2022,2021框，然后与搜索按钮，其中有输入提交类型。在下面的页面上，我得到了30+页面中的700+名称和描述的列表，我需要在Excel中有3个单独的表(例如。名称+排名和年份与描述在单独的列中) 我尝试了各种缝合的尝试，但都不起作用。这是我的最后一次尝试，但我总体上有点迷失了。 class Names(scrapy.Spider): name = 'enseafr' settings = get_project_s

浏览 21提问于2020-09-14得票数 0

1回答

将Python请求转换为Python请求时，request.post()无法工作

python、scrapy、python-requests、scrapy-spider

我有简单的邮政请求代码。 headers = { dictionary of headers } params = ( ('param1', '0'), ('param2', '5668294380'), ('param3', '8347915011'), ) response = requests.post('https://website.com', headers=headers, params=params, data=__data) 它作

浏览 5提问于2017-04-07得票数 0

1回答

粗糙的FormRequest不能将复杂的数据作为格式数据处理

python、web-scraping、scrapy、form-data、scrapy-shell

我试图向scrapy.FormRequest对象提供格式数据。表单数据是以下结构的一部分： { "param1": [ { "paramA": "valueA", "paramB": "valueB" } ] } 通过与以下代码等效的方法，在scrapy shell中运行： from scrapy import FormRequest url = 'www.example.com' method_post = 'POST' formd

浏览 0提问于2019-04-09得票数 1

回答已采纳

1回答

刮取数据的刮取请求表格

html、web-crawler、scrapy

我使用这段代码，我使用的是url= from __future__ import absolute_import #import __init__ #from scrapy.spider import BaseSpider from scrapy.contrib.spiders import CrawlSpider, Rule from scrapy.http import Request from scrapy.http import FormRequest from scrapy.http import Response from scrapy.selector import HtmlXP

浏览 1提问于2014-03-28得票数 0

2回答

是否有可能在scrapy中执行此代码模式？

python、web-scraping、scrapy

使用scrapy，我想先从一些页面收集urls，然后解析找到的每个urls并生成项目。例如，代码如下所示： def parse(self, response): # collect urls first urls = self.collect_urls(response) # parse urls found for url in urls: self.parse_url(url) # will yield Item inside def collect_urls(reponse): urls = response.meta.ge

浏览 7提问于2014-12-25得票数 0

回答已采纳

1回答

如何才能得到包含json的身体？

python、json、post、scrapy

[ ] 我尝试过Post方法，但仍然无法获得第3200页的json。我是这样编码的： url = u'http://218.57.139.24/pub/jyyc/3200' my_data ={u"encrpripid":u"b05bbaf0a62b2e049e005b9467ccbcc6f1d57daf702342a8457db88ba15021f7"} yield scrapy.FormRequest(url, method ='POST', formdata = my_data , callback=self.par

浏览 4提问于2016-04-14得票数 0

回答已采纳

1回答

刮伤能基于id向输入提交吗？

python、beautifulsoup、scrapy

我有一个包含多个输入字段的内联网页面，我需要Scrapy使用网页“搜索产品”输入字段进行搜索，它有一个"searchBox“id。我已经能够锁定正确的搜索框使用Scrapy和Beautiful，但我不知道如何将数据正确地传递回Scrapys表单提交功能。在方法1中，我尝试将结果简单地作为输入传递给Scrapys FormRequest.from_response函数，但是它不起作用。方法1-使用Scrapy查找数据 #Search for products def parse(self, response): ##Let's try search using s

浏览 0提问于2019-03-09得票数 1

1回答

使用scrapy登录网站时出现问题

python、web-scraping、scrapy、scrapy-spider

我想登录一个网站，然后删除一些细节，但不能使用scrapy登录。下面是我的代码： from scrapy import Spider from scrapy.http import FormRequest from lxml import html from scrapy.utils.response import open_in_browser class QuotesSpider(Spider): name = 'quotes' start_urls = ('https://app.thecoachingmanual.com/login'

浏览 36提问于2019-02-02得票数 0

2回答

用隐藏链接url的__doPostBack进行抓取

javascript、python、scrapy、dopostback

我正试图从使用__doPostBack功能的网站中抓取搜索结果。该网页显示每个搜索查询的10个结果。要查看更多结果，必须单击一个触发__doPostBack javascript的按钮。经过一些研究后，我意识到POST请求的行为就像表单一样，可以简单地使用scrapy的FormRequest来填充该表单。我使用了以下线程：编写以下脚本。 # -*- coding: utf-8 -*- from scrapy.contrib.spiders import CrawlSpider from scrapy.http import FormRequest from scrapy.http imp

浏览 4提问于2014-05-27得票数 10

回答已采纳

2回答

Scrapy搜索查询中的POST请求

python、scrapy、web-crawler、scrapy-spider

我试图使用一个抓取蜘蛛爬行一个网站，使用一个FormRequest发送关键字到一个特定城市的网页上的搜索查询。看上去很直截了当，但我有麻烦了。Python非常新，很抱歉，如果有明显的东西，我忽略了。以下是我试图帮助我的三个主要站点:鼠标与Python 1；；Scrapy.org 3 来自我正在爬行的特定url的源代码：www.lkqpickyourpart.com\locations/LKQ_Self_Service_-_Gainesville-224/recents 从我找到的特定页面的来源：<input name="dnn$ctl01$txtSearch" type

浏览 4提问于2016-03-23得票数 4

回答已采纳

1回答

手柄用刮痕一个接一个地重定向

redirect、python-2.7、scrapy、http-post

我写了一个蜘蛛，它有一个start_url。我的蜘蛛的parse方法会丢弃一些数据并返回一个FormRequests列表。这一问题与该邮件请求的答复有关。它用一些不相关的GET参数将我重定向到另一个站点。唯一重要的参数似乎是头中发布的一个SESSION_ID。不幸的是，Scrapys的行为是一个接一个地执行我的请求，并将重定向响应排在队列的末尾。如果所有返回的FormRequests都被执行，scrapy将开始执行所有重定向，这些重定向都返回相同的站点。如何避免这种行为，以便执行FormRequest，并在任何新的FormRequest之前执行请求响应中返回的重定向？也许还有另外一种方法，

浏览 1提问于2014-01-11得票数 0

回答已采纳

1回答

Python回调没有发生

python、authentication、request、scrapy

我正在编写一个python脚本，使用Scrapy来抓取一个有登录页面的网站。我正在尝试使用Scrapy的FormRequest.from_response来填充表单，但是我没有成功，也不知道为什么，但似乎没有调用from_response中声明的回调函数。我的间谍代码如下： class user_scrape(CrawlSpider): name = "spyder" allowed_domains = ["domain.tld"] start_urls = [ "http://domain.tld/page1", "h

浏览 1提问于2016-01-21得票数 1

回答已采纳

1回答

Python Scrapy -无法登录到站点

python、scrapy

当涉及到Scrapy时，我是一个新手，多亏了文档，我了解底层的基本抓取和爬行操作。然而，我在登录网站时遇到了困难。下面是我的代码： test.py import scrapy from scrapy.http import FormRequest from scrapy.utils.response import open_in_browser class Test_spider(scrapy.Spider): """ Log into the provided site with Scrapy """ nam

浏览 0提问于2018-11-20得票数 1

1回答

scrapy:从javascript生成的表单中抓取数据

javascript、python、scrapy

我指的是堆栈溢出中列出的以下问题：我试图复制@Rho给出的这个问题的答案，以学习如何从javascript生成的表单中抓取数据。自从这个问题发布以来，表单的有效载荷似乎发生了变化，所以我已经相应地修改了。我的代码和输出如下： >>>scrapy shell https://www.mcdonalds.com.sg/locate-us/ 2015-07-07 12:09:28+0800 [scrapy] INFO: Scrapy 0.24.6 started (bot: scrapybot) ..... 2015-07-07 12:09:28+0800 [default]

浏览 3提问于2015-07-07得票数 1

回答已采纳

1回答

Scrapy的FormRequest没有给出结果

python、request、scrapy

我正在使用Scrapy来尝试在网站上进行搜索。我正在改变的领域是Número do Processo na ORIGEM，id 'idNumeroOriginario‘。然而，Post方法似乎并没有改变页面上的任何内容。下面是代码： import scrapy from scrapy.utils.response import open_in_browser class MinimalSpider(scrapy.Spider): name = 'stj-spider' start_urls = ['https://ww2.stj.jus.b

浏览 0提问于2018-01-01得票数 2

回答已采纳

1回答

下面的POST方法不适用于刮伤。

python-2.7、scrapy、scrapy-spider、scrapy-pipeline、scrapy-shell

我也尝试过使用headers、cookie、Formdata和body，但是我获得了401和500的状态代码。在这个站点中，第一页在GET方法中&给出HTML响应，更多的页面在POST方法中&给出JSON响应。但是这些状态代码是为了未经授权而到达的，但是我已经搜索过了，并且在网页标题中找不到任何CSRF令牌或auth令牌。 import scrapy from SouthShore.items import Product from scrapy.http import Request, FormRequest class OjcommerceDSpider(scrapy.S

浏览 4提问于2016-12-10得票数 0

回答已采纳

1回答

适用于AJAX滚动页面的FormRequest

ajax、scrapy

我想刮所有的‘腰带’从https://www.thingiverse.com/thing:3270948/remixes在Scrapy。 ? 首先，我想写一个合适的请求。我试过了： scrapy.FormRequest(url="https://www.thingiverse.com/thing:3270948/remixes", method="POST", formdata={ 'page': '7', 'id': '3270948'}, headers=

浏览 10提问于2019-05-03得票数 0

回答已采纳

1回答

使用scrapy从facebook中抓取数据

facebook、web、web-crawler、scrapy

facebook上的新图表搜索允许您使用查询令牌搜索一家公司的现有员工- Current Google (例如)。我想通过刮擦刮刮结果页面()。最初的问题是facebook只允许facebook用户访问信息，因此将我引向login.php。因此，在抓取这个url之前，我通过scrapy登录，然后通过这个结果页面登录。但是，即使这个页面的http响应是200，它也不会丢弃任何数据。守则如下： import sys from scrapy.spider import BaseSpider from scrapy.http import FormRequest from scrapy.selec

浏览 3提问于2013-05-31得票数 5

2回答

如何识别需要发送的请求的关键信息？

web-scraping、scrapy、session-cookies、scrapy-spider

我想从使用自动完成请求的那里节省一些费用。这是我的密码： import scrapy from scrapy.http import Request, FormRequest import urllib class CabforceSpider(scrapy.Spider): name = 'cabforce' start_urls = ['https://www.cabforce.com'] complete_url = 'https://www.cabforce.com/v1/geo/autocomplete'

浏览 0提问于2015-07-23得票数 0

回答已采纳

1回答

使用PostBack数据javascript url在页面中进行抓取不会改变

python、scrapy、web-crawler

我正在通过Scrapy使用ASP.NET编程在一些目录中爬行。要爬行的页面编码如下： javascript:__doPostBack('MoreInfoListZbgs1$Pager','X') 其中X是1到180之间的整数。问题是，当我单击“下一页”或任何页面时，url仍然保持不变。我已经在下面写下了一些代码，它们只能提取第一页内的每个链接。 # -*- coding: utf-8 -*- import scrapy from bs4 import BeautifulSoup import re from scrapy.http import FormReq

浏览 1提问于2021-03-11得票数 2