腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
从
配置
导入
设置
,
显示
我
的
scrapy
代码
中有
一些
错误
、
我
正在尝试运行任何粗糙
的
代码
,
我
得到了这个
错误
,不知道为什么 File "/usr/local/bin/
scrapy
", line11, in <module> File "/usr/local/lib/python2.7/dist-
浏览 9
提问于2016-07-25
得票数 0
1
回答
为什么
Scrapy
不爬行/解析?
这可能是一个重复
的
问题。
我
正在尝试运行一个
Scrapy
爬虫,但无法运行。为什么
我
得到
错误
信息"HtmlResponse没有属性urljoin"?如果request_count是3,response_count也是3,那么
Scrapy
统计数据意味着什么?
我
的
代码
在这里。在这件事上如果能有任何帮助,
我
将不胜感激。import
scrapy
from
scrapy
.h
浏览 2
提问于2016-09-28
得票数 0
2
回答
在
Scrapy
中拥有“
设置
配置
文件”最简单
的
方法是什么?
Scrapy
从
settings.py获取
设置
(有默认
设置
、项目
设置
、每个爬行器
的
设置
)。
我
正在寻找
的
是能够有一个以上
的
文件与
设置
,并能够在它们之间切换,因为
我
启动
我
的
蜘蛛快速。如果文件之间有
一些
继承,那也是很棒
的
。 如果你
从
Java世界了解Spring Boot,就会有一个关于
配置</
浏览 0
提问于2019-03-14
得票数 3
2
回答
从
Python脚本中运行
scrapy
- CSV导出程序不起作用
、
、
、
、
当我从命令行运行它时,
我
的
刮取器工作得很好,但是当我试图在python脚本中运行它(使用使用Twisted
的
方法概述 )时,它不会输出它通常所做
的
两个CSV文件。
我
有一个创建和填充这些文件
的
管道,其中一个使用CsvItemExporter(),另一个使用writeCsvFile()。self.edges.append([item['url'],url,'Directed',self.num,'',1])
浏览 3
提问于2013-07-20
得票数 6
回答已采纳
1
回答
ImportError:无法
导入
名称ScrapyFileLogObserver
、
、
、
、
我
试着用ScrapyFileLogObserver测试刮伤日志。在
我
的
源
代码
中,
我
正确地将包
设置
为:
从
scrapy
.log
导入
ScrapyFileLogObserverImportErro
浏览 0
提问于2015-08-05
得票数 3
回答已采纳
2
回答
如何通过Django应用程序调用
Scrapy
Spider
、
、
、
在
我
的
django视图中,
我
在调用抓取蜘蛛时遇到了麻烦。
我
该怎么做呢?
我
尝试按照本教程进行操作,但在
导入
设置
中不起作用。
浏览 0
提问于2013-02-14
得票数 6
回答已采纳
1
回答
没有名为'
scrapy
.conf‘
的
模块
、
我
正在尝试执行来自https://github.com/jonbakerfish/TweetScraper
的
推特scraper
代码
当我在命令提示符中运行命令
scrapy
list以确保正确
设置
刮片时,
我
得到以下
错误
:
我
已经尝试安装
scrapy
了。
从
scrapy
.conf
导入
设置
ModuleNotFoundError:没有
浏览 46
提问于2019-09-08
得票数 1
4
回答
scrapy
日志处理程序
、
、
我
在以下两个问题上寻求您
的
帮助-如何像在python中那样为不同
的
日志级别
设置
处理程序。目前,
我
有STATS_DUMP = True 但是
Scrapy
生成
的
调试消息也会添加到日志文件中。这些都是非常长
的
和理想
的
,
我
希望调试级别的消息留下
的
标准
错误
和信息消息被转储到我<e
浏览 2
提问于2011-11-30
得票数 4
回答已采纳
1
回答
Scrapy
+ heroku:没有名为“扭曲邮件”
的
模块
、
、
、
Scrapy
==1.0.5当我将应用程序推到heroku上时,日志
显示
Twisted已经成功安装。在
我
的
代码
中有
一些
地方:from
scrapy
.crawler import CrawlerProcess process = CrawlerProcess,我会得到以下
错误
文件"/app/
浏览 0
提问于2016-02-24
得票数 0
回答已采纳
2
回答
scrapy
版本0.22.1
的
多页抓取- "cannot import name CrawlSpider“
错误
是什么意思?
、
、
我
正在尝试编写一个爬虫来跨多个页面爬行,通过以下网址:
我
正在使用
Scrapy
版本0.22.1来做这件事。但是,
我
收到一条"cannot import name CrawlSpider“消息。
我
已经粘贴了下面蜘蛛
的
代码
。有人能确定
我
哪里出错了吗?from
scrapy
.spider import CrawlSpider, Rule from
scrapy
.linkextractors.sgml import
浏览 0
提问于2015-02-14
得票数 1
1
回答
使用芹菜时不遵循链接
的
刮伤蜘蛛
、
、
、
、
我
是一个用Python编写
的
爬虫,它可以抓取给定域中
的
所有页面,作为特定领域搜索引擎
的
一部分。
我
用Django,
Scrapy
和芹菜来达到这个目的。设想情况如下:crawl.delay(domain)from .crawler.crawl(
我
知道,效率不高)。.items import HTMLP
浏览 0
提问于2014-06-15
得票数 4
回答已采纳
1
回答
scrapy
上
的
多个蜘蛛
、
、
我
用姜戈,芹菜,
scrapy
。
我
对芹菜
的
设置
:CELERY_TIMEZONE = TIME_ZONE "title": title,
浏览 0
提问于2018-06-21
得票数 0
1
回答
如何通过setuptools安装Crawlera
、
、
、
、
我
想在码头安装爬虫avec setuptools。在
我
的
scrapy
.cfg文件
中有
:url = http://localhost:6800/
我
用scrapyd-deploy -l测试test http://localhost:6800/ 在
我
的
setup.py中,
我
从</
浏览 3
提问于2017-03-24
得票数 1
回答已采纳
1
回答
刮伤教程扭曲
错误
、
我
对
Scrapy
很陌生,对python只有一个基本
的
理解。
我
到目前为止已经采取
的
步骤 安装了
scrapy
从
scrapy
\脚本\教程中,
我
运行了
scra
浏览 0
提问于2016-11-05
得票数 0
回答已采纳
2
回答
如何使用http请求启动
我
的
刮伤蜘蛛?
、
、
我
是Python中较新
的
一个,
我
只是用
scrapy
编写了
一些
蜘蛛。现在,
我
想使用http请求激活
我
的
蜘蛛,如: 启动uwsgi: uwsgi -
浏览 0
提问于2016-01-28
得票数 2
回答已采纳
3
回答
当使用requests.session登录www.researchgate.net时,
我
得到了一个"403禁止
的
“,警告说”您
的
浏览器不接受cookies“。
、
、
、
我
正在用python为编写一个网络爬虫。当我尝试使用requests.Session登录时,
我
得到一个"403禁止“
的
页面,警告说”您
的
浏览器不接受Cookie。需要Cookie才能使用此站点。下面是
我
的
代码
:from bs4 import BeautifulSoupter 'User-Agent':'Mozillaprint s.text s
浏览 0
提问于2016-04-12
得票数 0
1
回答
无法
导入
刮伤包
、
我
试着在
一些
代码
中使用刮伤。但是,
我
从
Visual
代码
中得到了
错误
:
我
认为答案很简单,但我想不出答案。使用pip install
scrapy
后,
我
打开Python控制台,
导入
scrapy
,然后使用
scrapy
.__ file __
浏览 0
提问于2019-06-11
得票数 2
回答已采纳
2
回答
Netbeans:符合CodeIgniter
代码
标准
的
代码
格式化程序
、
、
我
所在
的
公司正在使用带有PHP Codeigniter
的
Netbeans。不幸
的
是,默认
的
Netbeans
代码
"Format“选项并不能生成我们
的
一些
开发人员想要
的
Codeigniter
代码
标准。有没有人知道Netbeans插件可以用不同
的
方式或基于不同
的
标准格式化
代码
?
浏览 1
提问于2012-07-14
得票数 3
7
回答
在Visual
代码
中调试
Scrapy
项目
、
、
、
、
我
有一个Windows机器上
的
Visual
代码
,
我
正在它上做一个新
的
。爬行器工作正常,但我想调试
代码
,为此
我
在
我
的
launch.json文件中添加了以下内容: "name": "
Scrapy
with Integrated Terminal/Console",config:python.pythonPath}", "progra
浏览 1
提问于2018-03-09
得票数 23
回答已采纳
1
回答
当
scrapy
在conda虚拟环境中时,如何在pycharm中调试
scrapy
、
、
当
从
conda虚拟环境运行时,
我
正在尝试用py魅力调试
scrapy
。
我
遵循这个链接,它通常是工作
的
,但是如果
我
使用conda虚拟环境中
的
scrapy
,就会得到
导入
http.client ModuleNotFoundError:没有名为“http.client”
的
模块
我
检查了一下,虚拟环境中确实有http.client。另外,还会
导入
来自同一个文件夹(ex hashlib.py)<
浏览 0
提问于2019-04-08
得票数 1
点击加载更多
相关
资讯
scrapy官方文档提供的常见使用问题
Python Scrapy使用实例讲解
Python scrapy第二篇
Scrapy源码(2)——爬虫开始的地方
走进成熟的爬虫框架
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券