我正在使用scrapy从网站上抓取数据
def start_requests(self):
request = scrapy.Request(url="http://www.xxxxx.com",callback=self.parse ,dont_filter = True,)
yield request
从start_requests请求url时,我遇到错误
raise SchemeNotSupported("Unsupported scheme: %r" % (uri.scheme,))
twisted.web.error.SchemeNotSupported: Unsupported scheme: b''
2018-06-11 13:02:26 [scrapy.core.engine] INFO: Closing spider (finished)
2018-06-11 13:02:26 [scrapy.statscollectors] INFO: Dumping Scrapy stats:
但是,当使用安全线路(即“https://www.xxxxx.com”)调用相同的请求时,它是有效的。有人能帮忙吗?
发布于 2019-09-12 12:29:25
我也有同样的问题,对我来说,问题是协议。
我使用http
请求,而它应该是https
当我改变它的时候,它开始工作了。
https://stackoverflow.com/questions/50792623
复制