在start_urls中使用变量时，该变量将变为未定义

是因为在爬虫的启动过程中，start_urls是在类定义时就被解析的，而变量的值是在运行时才能确定的。因此，如果在start_urls中使用变量，爬虫启动时该变量还没有被赋值，所以会被认为是未定义的。

为了解决这个问题，可以使用start_requests方法来动态生成初始请求。在start_requests方法中，可以根据变量的值构造请求，并指定回调函数来处理响应。这样就可以在运行时使用变量的值，而不会出现未定义的情况。

以下是一个示例代码：

import scrapy

class MySpider(scrapy.Spider):
    name = 'my_spider'
    
    def __init__(self, my_variable=None, *args, **kwargs):
        super(MySpider, self).__init__(*args, **kwargs)
        self.my_variable = my_variable
    
    def start_requests(self):
        # 根据变量的值构造请求
        url = 'http://example.com/{}'.format(self.my_variable)
        yield scrapy.Request(url, callback=self.parse)
    
    def parse(self, response):
        # 处理响应
        # ...

在上面的代码中，通过在Spider类的构造函数中接收变量my_variable，并将其保存为Spider对象的属性。然后，在start_requests方法中使用该变量的值构造请求。这样，当爬虫启动时，可以通过命令行参数或其他方式传递变量的值，从而动态生成初始请求。

需要注意的是，start_requests方法返回的是一个可迭代对象，每个元素都是一个请求对象。在这个示例中，使用yield语句返回了一个请求对象，这样可以保证每个请求都会被处理。

对于Scrapy框架，腾讯云提供了云爬虫（Cloud Crawler）服务，可以帮助用户快速构建和部署爬虫应用。云爬虫提供了分布式爬虫、反爬虫策略、数据存储等功能，适用于各种爬虫场景。更多关于云爬虫的信息和产品介绍可以参考腾讯云的官方文档：云爬虫产品介绍。

在start_urls中使用变量时，该变量将变为未定义

python、web-scraping、scrapy

我正在尝试弄清楚如何将pid附加到base_url，以便使它们成为合格的urls。我知道我可以在start_urls中直接使用这个https://www.somesite/search/?id=来实现这一点，但是我想知道如何在start_urls中使用这个变量base_url，因为它目前抛出了一个错误，表明base_url没有定义。文本文件中的ID类似于2354，0957 e.t.c。open('num

浏览 20提问于2020-06-12得票数 0

回答已采纳

1回答

变量JS的Substract值

javascript

但由于某种原因，我的功能从生产出来的产品中减去那部分，是不起作用的，我可以因为某种原因产生无限的金钱。我尝试在控制台中检查子字符串后的值是什么，但它没有变化。

浏览 1提问于2014-11-07得票数 0

回答已采纳

1回答

基于Google的OOP Javascript回调方法

javascript、oop

我正在尝试使我的日历事件读取器在javascript中。在checkAuth()函数上，当调用handleAuthResult时，会观察到以下内容。当使用this.handleAuthResult时，方法handleAuthResult()中的变量this.config.myvar将变为未定义。当使用this.handleAuthResult()时，方法handl

浏览 2提问于2015-04-02得票数 2

回答已采纳

1回答

将Javascript变量作为参数传递给函数时，该变量将变为未定义

javascript、angularjs

在我的程序中的不同位置，我调用该服务来获取某个东西的currentValue。console.log('ViewContext resetCurrent: ' + domain); };在我的控制器中，我将这个CrsViewContext作为参数传递，然后做一些类似这样的事情 .controller('MyCtrl', function (CrsViewContext

浏览 2提问于2014-06-21得票数 0

1回答

c: extern变量不保留值

c、extern

我使用的是外生bool变量。我已经将其初始化(为true)，并希望在程序中的其他地方使用此值。但问题是，当进入另一个模块时，这个真值将变为false，当从该模块返回时(最后一次看到该值为true)，则该值将变为true。我不明白为什么外生变量是这样的。有人知道这事吗？我希望extern变量保留它的值，就像它应该

浏览 12提问于2022-12-03得票数 -1

1回答

下面的Fortran 'do concurrent‘循环是否有效？

fortran、gfortran、fortran2008

然而，gfortran没有给我任何形式的警告，并且acc中的结果值在55是正确的。它是有效还是无效？

浏览 5提问于2017-02-22得票数 2

1回答

在defun中引用变量后，该变量变为未定义

common-lisp

大家好，stackoverflow的好朋友，我在关注的时候遇到了一个奇怪的问题。这个问题可能是Clozure CL的问题，但是我只是想提供一些背景知识。发生的事情很简单。我通过执行(defvar *games* '())来声明变量*games*。当我声明一个引用这个变量的函数时，比如game-from-name，编译器就会对我大喊未声明的自由变量*games*。

浏览 0提问于2011-07-20得票数 0

回答已采纳

1回答

D3.文本函数中的作用域问题

javascript、asynchronous、d3.js

我使用d3. .txt函数读取.txt文件。我可以使用函数中读取的值。但是，如果我将该值读入函数之外声明的变量中，则该变量在函数结束后立即变为未定义。console.log(fileString); //Print the correct Stringconsole.log(fileString); //Print undefined 如何在函数完成后保留变量

浏览 6提问于2014-05-18得票数 0

回答已采纳

2回答

调用unset()后的奇怪输出

php

NULL的表示，如果我对变量调用unset()，则变量将变为NULL：它被分配为常量NULL。它已被unset().但是，此表示，在对变量调用unset()时将发生以下情况： PHP在符号表中查找与此变量相对应的zval，减少折算，并从符号表中移除该变量。&g

浏览 0提问于2018-03-15得票数 1

1回答

在一个单程OpenGL中绘制一个cubemap

c++、opengl

我试图用OpenGL中的几何阴影在一次传递中绘制一个cubemap。基本上，我需要这样做，以便将cubemap的内容复制到另一个cubemap中，并且可能没有相同的分辨率和像素布局。使用NSight，我可以看出出了一些问题。这是结果库图：唯一被画出来的是正X，但它仍然不正确。vec4 FragColor; { FragColor = texture(AtmosphereMap, frag_textureCoord)

浏览 3提问于2016-06-08得票数 1

2回答

对象变量，以在除会话和cookie之外的页面刷新后保留值。

javascript、web

想知道除了使用会话和cookie之外，在页面刷新后是否还有其他方法来保留对象变量。尝试了window.name，但该值在页面刷新后变为未定义。localStorage是好的，但糟糕的是它只存储在字符串值中，而不是对象值中。

浏览 2提问于2016-05-24得票数 0

回答已采纳

4回答

本地Javascript作用域问题

javascript、scope

local a = global a console.log("fn",a);输出为：0 为什么自执行函数中的

浏览 0提问于2012-07-13得票数 8

回答已采纳

1回答

无法将api调用结果设置为角1应用程序中的变量。

javascript、angularjs、api、post

我试图调用一个api，并将结果设置为一个变量。当我将数据记录在控制台中时，我能够成功地进行调用并查看数据，但稍后当我尝试使用变量时，它是未定义的。当调用console.log(结果)时，结果是未定义的。我知道api调用正在工作，因为我可以在控制台中看到数据。问题是我不能将这些数据存储在我的结果<

浏览 1提问于2022-02-28得票数 0

3回答

传入未定义的目的是什么？

javascript、jquery、plugins

我注意到像jQuery.UI这样的jQuery和相关的keynote插件将undefined作为参数传递给在其模块定义中使用的匿名函数，如下所示：或者，我注意到jQuery推荐的其他插件和/或其他插件不会将未定义的插件作为参数传入。

浏览 0提问于2012-03-07得票数 60

回答已采纳

1回答

将不正确的值读入变量的尝试会改变它的值吗？

input、error-handling、fortran、fortran2003

然后，如果我试图将一个不正确的值读入标量变量，i说，这个变量会保持不变吗？write (*, "('Bad integer. i is still ', I0)") i end do我能依赖Fortran 2003中的这种行为吗

浏览 6提问于2015-02-11得票数 2

回答已采纳

1回答

Fortran可分配数组生存期

memory-management、fortran、fortran90、dynamic-memory-allocation、fortran95

returnend 变量var1会被分配两次吗？(我想是的)。如果为每次调用分配内存，那么在第一次调用时分配的内存是否会空闲？

浏览 2提问于2012-08-07得票数 0

回答已采纳

2回答

如何检查是否保持，单击Android /java

java、android、button

当我持有变量时，变量将变为true；在释放变量时，变量将更改为false。我该怎么做(Android )谢谢

浏览 7提问于2022-03-17得票数 0

回答已采纳

2回答

Angular HTML属性布尔值未首次更新

angular

我有一个按钮，当我的component.ts文件中的一个变量为空、未定义或0时，我想禁用它。该按钮在启动时被禁用，并在应该启用时变为启用状态，但之后不会返回到禁用状态。当对表进行排序时，该按钮将启用，但当单击clear sort按钮时，该按钮直到单击两次后才会禁用。

浏览 15提问于2019-09-10得票数 0

1回答

登录解析url列表后的抓取

python、scrapy、scrapy-spider

所以我的剪贴用一个从站点地图获取的urls列表作为start_urls，它应该向登录表单发出请求，然后，如果登录，它应该开始解析我的列表.name = "logged-in" d = strftime("%Y-%m-%d", gmtime()) f = open("data/site

浏览 0提问于2015-12-03得票数 4

1回答

如何根据同一波段的子报表返回值给出详细信息带的表达式？

jasper-reports

我使用的是iReports 4.7.1 我有两个子报告在我的主要报告，他们是在散居的乐队。如果子报告没有返回任何行，我需要隐藏带。我能够在我的主要报告中获得子报表值。但是，如果我在同一波段中使用该变量作为表达式，则该变量的值将变为空，如果在其他详细信息带中使用相同的变量，则该变量不会变

浏览 4提问于2016-02-09得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在start_urls中使用变量时，该变量将变为未定义

相关·内容

在start_urls中使用变量时，该变量将变为未定义

变量JS的Substract值

基于Google的OOP Javascript回调方法

将Javascript变量作为参数传递给函数时，该变量将变为未定义

c: extern变量不保留值

下面的Fortran 'do concurrent‘循环是否有效？

在defun中引用变量后，该变量变为未定义

D3.文本函数中的作用域问题

调用unset()后的奇怪输出

在一个单程OpenGL中绘制一个cubemap

对象变量，以在除会话和cookie之外的页面刷新后保留值。

本地Javascript作用域问题

无法将api调用结果设置为角1应用程序中的变量。

传入未定义的目的是什么？

将不正确的值读入变量的尝试会改变它的值吗？

Fortran可分配数组生存期

如何检查是否保持，单击Android /java

Angular HTML属性布尔值未首次更新

登录解析url列表后的抓取

如何根据同一波段的子报表返回值给出详细信息带的表达式？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐