我正在研究付费代理蜘蛛模板,并希望能够在Scrapy爬虫的命令行上传递一个新的参数。我怎么能这么做?
发布于 2022-04-13 14:36:44
这可以通过在蜘蛛的_-方法中使用kwargs
来实现:
import scrapy
class YourSpider(scrapy.Spider):
name = your_spider
def __init__(self, *args, **kwargs):
super(YourSpider, self).__init__(*args, **kwargs)
self.your_arg = kwargs.get("your_cmd_arg", 42)
现在可以按以下方式调用这种蜘蛛:
scrapy crawl your_spider -a your_cmd_arg=foo
有关该主题的更多信息,请查看Scrapy文档中的此页。
https://stackoverflow.com/questions/71858762
复制相似问题