我正在用Scrapy构建一个简单的(Ish)解析器,对于scrapy和Python :-)在文件item.py中,我对thisItem()有一个定义,我在下面的代码中为item分配了一个定义。所有的工作都很顺利,parse使用回调来到达parse_dir_content.但后来我意识到,我需要额外刮一点数据,并创建了另一个函数parse_other_content。href in response.xpath('//h3/a/@href'):
我使用教程蜘蛛作为模板,然后创建了一系列启动请求并让它从那里爬行,使用如下所示: f = open('zipcodes.csv', '这样做的结果是一个重复的大异常,结果如下:
File "C:\Python27\lib\site-packages\scrapy\utils\defer.py", line 57, in <genexpr\lib\site-packages\scrapy\utils