在scrapy中使用ItemLoader将缺省值设置为None的KeyError处理_在ExtJS 3.4中使用Json将缺省值设置为ComboBox_如何在5秒后将"display:none“设置为之前在JavaScript中设置的"display:initial”？ - 腾讯云开发者社区

python、scrapy

浏览简陋的教程，并开始使用项目加载器来收集数据。我使用的数据包括从通过JSON加载的预定义字典和由爬行器跟随的产品页面中读取数据。我遇到的问题是，字典有时没有可用键(如'salePrice')，这会导致爬网中出现KeyError并完全停止执行。我正在尝试看看在items.py中是否有一种干净的方法来处理这个字段的KeyErrors，其中

浏览 33提问于2020-12-27得票数 0

1回答

跨多个响应使用ItemLoader加载项文件

python、scrapy

这是一个被接受的问题答案的后续问题。我希望使用ItemLoader从多个请求收集值到单个Item。接受的答案建议通过Item.load_item()中的meta字段将加载的request传递给下一个请求。但是，当在爬行结束时返回加载的对象时，我想将output_processors应用于单个字段的所有收集值。实现这一目标的最佳途径是什么？我是否可以将ItemLo

浏览 2提问于2019-01-09得票数 1

回答已采纳

1回答

如何使用itemloader填充空项？

python、web-scraping、scrapy、web-crawler

我的目标是获得卖家的信息。当我的爬行器访问一个没有卖家数据的页面时，我的商品字段'company'和'owner'没有填充任何数据。是的，我的字段没有填充也没关系。): owner = scrapy.Field() class GmarketLoader(Ite

浏览 17提问于2019-11-05得票数 1

1回答

刮刮:使用itemLoaderi.c.w.的最佳方法是什么。一条邮政管道？

python、postgresql、scrapy、scrapy-spider

我试图使用itemLoader在Scrapy中给空项一个默认值，如items.py中的如下所示： default=[],) 因此，如果没有设置prod_specs，它应该给它一个空对象。如果我尝试用item['prod_specs'].将字段存储

浏览 2提问于2014-07-11得票数 1

回答已采纳

1回答

ItemLoader objects classs crapy.loader.ItemLoader(item=None, selector=None, response=None, parent=None, **context)用户友好的抽象，通过应用字段处理器来抓取数据来填充数据项。Parameters item (scrapy.item.Item) --使用对add_xpath()、add_css()或add_v

浏览 4提问于2022-09-12得票数 1

回答已采纳

1回答

通过刮擦的项目加载器传递选择器

python、scrapy、screen-scraping

所以在抓取的时候，我在寻找一个元素，它是html代码中两个不同元素的组合。我正在考虑使用ItemLoaders of scrapy来消除这可能产生的丑陋代码。要达到这些元素，可以使用以下选择器：element_one = main_element.css('css_to_oneMyLoader(MyItem(), se

浏览 3提问于2022-01-21得票数 0

回答已采纳

1回答

使用scrapy将带有用户附加元素的数据放入csv

python、date、dictionary、scrapy、export-to-csv

我有一个使用scrapy的运行脚本，它从表中获取数据。但是由于原始数据是按行参数顺序保存的，所以它是按格式保存的：firstitem...如果没有类似的“名称”，我如何将这个数据保存为行格式我已经有了包含当前时间的列表，所以我需要将这个dict重写为一个列表，以便将其解析为CSV。编辑i用current_time参数替换了字典<e

浏览 3提问于2019-02-22得票数 1

回答已采纳

1回答

使用Scrapy* ItemLoader从多个元素解析文本的首n个字符*

python、scrapy

使用Scrapy的ItemLoader，我想解析HTML元素中的前n个字符(它将包含多个嵌入的HTML元素，每个元素可能包含或不包含构成要保留的文本的一部分的文本)。下面是一个示例设置：<div class="about-copy"> <p>Developers trust Stack Overflow to help solve cod

浏览 1提问于2017-06-03得票数 0

回答已采纳

2回答

将刮伤爬虫结果插入postgresql时出现的卷曲括号问题

python、web-scraping、scrapy、web-crawler

使用刮伤外壳时：并试图提取网址的标题：我得到：当我运行我的爬虫时，我在postgresql数据库中得到以下信息： {“Analysi

浏览 1提问于2014-10-27得票数 0

回答已采纳

1回答

如何将多个抓取的项目合并为一个项目？(Scrapy)

python、web-scraping、css-selectors、scrapy

假设我想使用选择器从中抓取文本从这里，我得到了项目列表[u'My image 1', u'My image 3', u'My image 5'] 如何合并此列表中<

浏览 1提问于2014-12-03得票数 0

2回答

在回调之间排除项加载器故障

python、csv、scrapy、web-crawler

为了理解中的“朴素方法”示例我正在尝试复制这段代码。这个想法是在每个字段都来自不同的网站的地方填充一个单独的项目。我试图理解为什么当我运行下面的代码并使用scrapy crawl compSpider -o prices.csv将结果导出到csv文件中时，我会从下面的代码中获得以下行为。代码实际上用相关的价格填充了nic_price，但它不会用tester_price做同样<em

浏览 1提问于2016-10-18得票数 1

2回答

如何动态生成字段

python、scrapy

当我查阅官方scrapy文档时，我发现字段可以动态添加，但我不知道如何做到这一点我尝试了ItemLoader的一个演示，它像测试代码一样成功：我为ItemLoader传递了一个field_name_list，就像一段代码：当我在ItemClass上看的时候，就像两个代码：当我运行代码时，它告诉我错误，但我打印了args，它成功通过了，就像三个代码：我忘记了传递运行代码，比如四个代码：我的self.fieldhttp://

浏览 10提问于2019-04-02得票数 2

回答已采纳

2回答

为什么我在Scrapy中的输入/输出处理器不能工作？

python、python-3.x、scrapy

我在试着跟踪。 item['desc'] = sel.xpath('text()').extract()我试着根据声明输入/输出处理器items.pyfrom scrapy.loader.processors import MapCompose, Join class

浏览 3提问于2016-05-16得票数 6

回答已采纳

1回答

获取AttributeError错误'str‘对象没有属性'get’

json、api、scrapy

在处理JSON响应时，我收到了一个错误：有什么问题吗？对于其余的值，我还会得到以下错误：'Phone'：value'_source'，KeyError：‘primaryPhone’* # -*- cod

浏览 0提问于2020-07-17得票数 0

回答已采纳

1回答

python、scrapy、namespaces、web-crawler、loading

我无法将刮伤项加载到刮伤蜘蛛中。以下是我的项目结构： .log ..scrapers ....__init__.py .tmpimport scrapy from __future__

浏览 1提问于2020-04-11得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云