当我试图抓取一个特定的网站时,我遇到了一个奇怪的问题。如果我使用basespider抓取一些页面,代码运行得很好,但如果我将代码更改为使用爬行器,爬行器完成时没有任何错误,但没有爬行。 from scrapy.spider import BaseSpider from scrapy.contrib.linkextractors.sgml import SgmlLinkExtractor
from scrapy.contrib.spiders impo
我有很多html文件,如下所示:<b></b>
According to the complaint filed January 04, 2011, over a six-week period in December 2007 and January 2008, six healthcare related hedge funds manag