从配置导入设置，显示我的scrapy代码中有一些错误

文章/答案/技术大牛

发布

2回答

、

我正在尝试运行任何粗糙的代码，我得到了这个错误，不知道为什么 File "/usr/local/bin/scrapy", line11, in <module> File "/usr/local/lib/python2.7/dist-

浏览 9提问于2016-07-25得票数 0

1回答

为什么Scrapy不爬行/解析？

这可能是一个重复的问题。我正在尝试运行一个Scrapy爬虫，但无法运行。为什么我得到错误信息"HtmlResponse没有属性urljoin"？如果request_count是3，response_count也是3，那么Scrapy统计数据意味着什么？我的代码在这里。在这件事上如果能有任何帮助，我将不胜感激。import scrapy from scrapy.h

浏览 2提问于2016-09-28得票数 0

2回答

在Scrapy中拥有“设置配置文件”最简单的方法是什么？

Scrapy从settings.py获取设置(有默认设置、项目设置、每个爬行器的设置)。我正在寻找的是能够有一个以上的文件与设置，并能够在它们之间切换，因为我启动我的蜘蛛快速。如果文件之间有一些继承，那也是很棒的。如果你从Java世界了解Spring Boot，就会有一个关于配置</

浏览 0提问于2019-03-14得票数 3

2回答

从Python脚本中运行scrapy* - CSV导出程序不起作用*

、、、、

当我从命令行运行它时，我的刮取器工作得很好，但是当我试图在python脚本中运行它(使用使用Twisted的方法概述 )时，它不会输出它通常所做的两个CSV文件。我有一个创建和填充这些文件的管道，其中一个使用CsvItemExporter()，另一个使用writeCsvFile()。self.edges.append([item['url'],url,'Directed',self.num,'',1])

浏览 3提问于2013-07-20得票数 6

回答已采纳

1回答

ImportError:无法导入名称ScrapyFileLogObserver

、、、、

我试着用ScrapyFileLogObserver测试刮伤日志。在我的源代码中，我正确地将包设置为：从scrapy.log导入ScrapyFileLogObserverImportErro

浏览 0提问于2015-08-05得票数 3

回答已采纳

2回答

如何通过Django应用程序调用Scrapy* Spider*

、、、

在我的django视图中，我在调用抓取蜘蛛时遇到了麻烦。我该怎么做呢？我尝试按照本教程进行操作，但在导入设置中不起作用。

浏览 0提问于2013-02-14得票数 6

回答已采纳

1回答

没有名为'scrapy.conf‘的模块

、

我正在尝试执行来自https://github.com/jonbakerfish/TweetScraper的推特scraper代码当我在命令提示符中运行命令scrapy list以确保正确设置刮片时，我得到以下错误：我已经尝试安装scrapy了。从scrapy.conf导入设置ModuleNotFoundError:没有

浏览 46提问于2019-09-08得票数 1

4回答

scrapy日志处理程序

、、

我在以下两个问题上寻求您的帮助-如何像在python中那样为不同的日志级别设置处理程序。目前，我有STATS_DUMP = True 但是Scrapy生成的调试消息也会添加到日志文件中。这些都是非常长的和理想的，我希望调试级别的消息留下的标准错误和信息消息被转储到我<e

浏览 2提问于2011-11-30得票数 4

回答已采纳

1回答

Scrapy + heroku:没有名为“扭曲邮件”的模块

、、、

Scrapy==1.0.5当我将应用程序推到heroku上时，日志显示Twisted已经成功安装。在我的代码中有一些地方：from scrapy.crawler import CrawlerProcess process = CrawlerProcess，我会得到以下错误文件"/app/

浏览 0提问于2016-02-24得票数 0

回答已采纳

2回答

scrapy版本0.22.1的多页抓取- "cannot import name CrawlSpider“错误是什么意思？

、、

我正在尝试编写一个爬虫来跨多个页面爬行，通过以下网址：我正在使用Scrapy版本0.22.1来做这件事。但是，我收到一条"cannot import name CrawlSpider“消息。我已经粘贴了下面蜘蛛的代码。有人能确定我哪里出错了吗？from scrapy.spider import CrawlSpider, Rule from scrapy.linkextractors.sgml import

浏览 0提问于2015-02-14得票数 1

1回答

使用芹菜时不遵循链接的刮伤蜘蛛

、、、、

我是一个用Python编写的爬虫，它可以抓取给定域中的所有页面，作为特定领域搜索引擎的一部分。我用Django，Scrapy和芹菜来达到这个目的。设想情况如下：crawl.delay(domain)from .crawler.crawl(我知道，效率不高)。.items import HTMLP

浏览 0提问于2014-06-15得票数 4

回答已采纳

1回答

scrapy上的多个蜘蛛

、、

我用姜戈，芹菜，scrapy。我对芹菜的设置：CELERY_TIMEZONE = TIME_ZONE "title": title,

浏览 0提问于2018-06-21得票数 0

1回答

如何通过setuptools安装Crawlera

、、、、

我想在码头安装爬虫avec setuptools。在我的scrapy.cfg文件中有：url = http://localhost:6800/我用scrapyd-deploy -l测试test http://localhost:6800/ 在我的setup.py中，我从</

浏览 3提问于2017-03-24得票数 1

回答已采纳

1回答

刮伤教程扭曲错误

、

我对Scrapy很陌生，对python只有一个基本的理解。我到目前为止已经采取的步骤安装了scrapy从scrapy\脚本\教程中，我运行了scra

浏览 0提问于2016-11-05得票数 0

回答已采纳

2回答

如何使用http请求启动我的刮伤蜘蛛？

、、

我是Python中较新的一个，我只是用scrapy编写了一些蜘蛛。现在，我想使用http请求激活我的蜘蛛，如：启动uwsgi: uwsgi -

浏览 0提问于2016-01-28得票数 2

回答已采纳

3回答

当使用requests.session登录www.researchgate.net时，我得到了一个"403禁止的“，警告说”您的浏览器不接受cookies“。

、、、

我正在用python为编写一个网络爬虫。当我尝试使用requests.Session登录时，我得到一个"403禁止“的页面，警告说”您的浏览器不接受Cookie。需要Cookie才能使用此站点。下面是我的代码：from bs4 import BeautifulSoupter 'User-Agent':'Mozillaprint s.text s

浏览 0提问于2016-04-12得票数 0

1回答

无法导入刮伤包

、

我试着在一些代码中使用刮伤。但是，我从Visual代码中得到了错误：我认为答案很简单，但我想不出答案。使用pip install scrapy后，我打开Python控制台，导入scrapy，然后使用scrapy.__ file __

浏览 0提问于2019-06-11得票数 2

回答已采纳

2回答

Netbeans:符合CodeIgniter代码标准的代码格式化程序

、、

我所在的公司正在使用带有PHP Codeigniter的Netbeans。不幸的是，默认的Netbeans代码"Format“选项并不能生成我们的一些开发人员想要的Codeigniter代码标准。有没有人知道Netbeans插件可以用不同的方式或基于不同的标准格式化代码？

浏览 1提问于2012-07-14得票数 3

7回答

在Visual代码中调试Scrapy项目

、、、、

我有一个Windows机器上的Visual代码，我正在它上做一个新的。爬行器工作正常，但我想调试代码，为此我在我的launch.json文件中添加了以下内容： "name": "Scrapy with Integrated Terminal/Console",config:python.pythonPath}", "progra

浏览 1提问于2018-03-09得票数 23

回答已采纳

1回答

当scrapy在conda虚拟环境中时，如何在pycharm中调试scrapy

、、

当从conda虚拟环境运行时，我正在尝试用py魅力调试scrapy。我遵循这个链接，它通常是工作的，但是如果我使用conda虚拟环境中的scrapy，就会得到导入http.client ModuleNotFoundError:没有名为“http.client”的模块我检查了一下，虚拟环境中确实有http.client。另外，还会导入来自同一个文件夹(ex hashlib.py)<

浏览 0提问于2019-04-08得票数 1

点击加载更多