腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
动态
定义
scrapy
项
、
我想把这个类传递给
scrapy
Itemloader。我知道这个类是错的,但是怎么做呢?class DummyItem(
scrapy
.Item): self.num = num self.num =
scrapy
.Field()
浏览 9
提问于2019-04-15
得票数 0
1
回答
scrapy
可以产生不同种类的物品吗?
、
我有两种物品: id =
scrapy
.Field() image_paths=
scrapy
.Field() #...other fields movie_
浏览 1
提问于2016-08-30
得票数 0
回答已采纳
2
回答
如何
使用
Scrapy
从
动态
加载的网站(Fincaraiz)中刮取链接
、
我想了解
如何
使用Python中的
Scrapy
从下面的页面提取数据 https://fincaraiz.com.co/inmueble/apartamento-en-arriendo/florida-blanca/bogota/6738284问题 这个页面
动态
加载内容,所以当我从
Scrapy
发出请求时,我得到的结果是HTML所以我不能应用XPath,因
浏览 18
提问于2022-02-18
得票数 0
1
回答
如何
在使用无限滚动加载的页面中刮取完整列表,每次请求的URL是相同的
、
、
、
如何
从https://www.baincapital.com/people中提取出所有的名字。我已经找出了我的选择器等,但它只是返回最初可见的信息。任何帮助都将不胜感激。到目前为止我的代码是:from
scrapy
_splash import SplashRequest
浏览 2
提问于2020-02-05
得票数 0
回答已采纳
2
回答
刮伤xpath不捕获标记
、
、
、
在这种情况下,我想让
Scrapy
提取出“圆形大小”。但事实证明,
Scrapy
无法捕捉dl下的任何子节点。我在
Scrapy
中启用了Ajax,它可以捕获其他
动态
项
。是否还有其他原因导致
Scrapy
的数据丢失?有人遇到过类似的问题吗?
浏览 7
提问于2016-06-06
得票数 0
回答已采纳
1
回答
刮痕爬行器
、
、
、
、
"Items.py“文件包含: passimport
scrapy
allowed_domains = ["craigslist.org
浏览 2
提问于2017-09-20
得票数 0
回答已采纳
1
回答
哪些元数据可以实际进入
scrapy
.Field对象?
、
、
我今天在
Scrapy
上复习了,并看到了下面这条线: class ScrapyPracticeItem(
scrapy
.Item): age =
scrapy
.Field我现在很困惑--有人能给我一个更好的
定义
元数据的
定义
吗?它们仅仅意味着
项
中数据的转
浏览 7
提问于2022-07-10
得票数 1
回答已采纳
2
回答
为什么我在
Scrapy
中的输入/输出处理器不能工作?
、
、
dmoz_spider.pyfrom tutorial.items import DmozItem yield itemitems.py import
scrapy
from
scrapy
.loader.processors impor
浏览 3
提问于2016-05-16
得票数 6
回答已采纳
1
回答
吝啬的剧作家被困在Telnet控制台上监听
、
、
我正在做一个练习项目,用刮擦器抓取
动态
加载的内容,但是我设法撞到了墙,不知道问题出在哪里。爬行器只是拒绝启动爬行过程,被卡在"Telnet控制台监听127.0.0.1:6023“部分上。09:55:19
scrapy
.extensions.logstats信息:爬行0页(0页/分钟),刮0
项
(0
项
/分钟) 2022-11-24 09:56:19
scrapy
.extensions.logstats信息:爬行0页(0页/分钟),刮0
项
(0
项<
浏览 32
提问于2022-11-24
得票数 1
回答已采纳
3
回答
Sqlalchemy :从
Scrapy
项
动态
创建表
、
、
我在使用sqlalchemy1.1和
scrapy
。我目前正在使用管道将提取的数据通过sqlalchemy存储在sqllite表中。我想
动态
地创建一个表来容纳被刮掉的项目。IntegrityError: return itemclass Filtered_Item(
scrapy
.Item): value2= <em
浏览 7
提问于2016-12-12
得票数 8
回答已采纳
1
回答
(Python/
Scrapy
/Splash) Spider突然开始打印空结果
、
、
、
系统: Windows 10,Python 2.7.15,
Scrapy
1.5.1 href =
scrapy
.Field() eventmonth =
scrapy</
浏览 3
提问于2018-09-23
得票数 0
回答已采纳
2
回答
在
scrapy
项目加载器上使用正则表达式
、
、
、
我正在尝试弄清楚
如何
在
scrapy
项目加载器中使用regex。我曾尝试将lambda函数与split()一起使用,但得到了以下错误。无法
定义
拆分。您可以看到该函数在项目加载器类中被注释掉了。我要做的是删除日期之前的所有文本,包括日期
项
的"/“。日期
项
是我刚刚解析的url。
如何
将正则表达式与
scrapy
项目加载器一起使用?spider.pyfrom
scrapy
_spl
浏览 4
提问于2018-02-20
得票数 0
回答已采纳
1
回答
逐列输出数据,我想逐行刮擦。这怎么可能呢?
、
、
、
下面是蜘蛛的代码和图片如下所示: rows=response.xpath('//*[@id="table-timetable"]/table/tbody') for row in rows: item['Day'] = row.xpath('.//tr/th/strong/text()').extract() item['
浏览 5
提问于2016-11-03
得票数 0
回答已采纳
1
回答
Scrapy
+ PostgreSQL -自
定义
ETL的自动项目和管道(截断>插入>插入>删除)
、
、
、
我已经有了一些实用的蜘蛛和代码来实现我想要的,但我正在寻找关于
如何
更有效地为我正在进行的项目整合事情的建议。我目前的程序包括:- Current Pipeline:是否可以直接从现有数据库表中填充/
定义
Scrapy
项
,而无需手动列出列?如果您在一个蜘蛛中有多个方法(解析、parse_
浏览 6
提问于2020-01-06
得票数 1
回答已采纳
2
回答
剪贴式项目更改列名
、
、
有没有办法在csv输出中更改列名,例如,我有这样的
scrapy
项
: import
scrapy
recordi =
scrapy
.Field我使用
scrapy
命令
scrapy
crawl myspider -o data.csv 并且data.csv中的列名也是recordi,所以我的问题是,我可以更改列名吗?scapy.Field()是否有任何参数,我可以在其中
定义
列名,如果它保留r
浏览 16
提问于2021-10-21
得票数 1
2
回答
用
scrapy
进行CPU密集型解析
、
、
、
CONCURRENT_ITEMS节将其
定义
为: 这让我很困惑。这是否意味着发送到管道的项目是并行处理的,即。应该在蜘蛛的解析方法本身中执行这些操作,还是应该发送包含整个响应的
项
,并让自
定义
管道类通过解析响应体来填充
项
的字段?
浏览 4
提问于2014-02-13
得票数 2
回答已采纳
2
回答
如何
在
Scrapy
中抓取多个级别的页面到一个项目?
、
我发现的所有
Scrapy
示例都谈到了
如何
抓取单个页面,或者
如何
抓取多个级别的页面,当每个最深的页面被保存为一个独立的Item时。但我的情况有点复杂。books)----> C (Book review pages)因此,Item的
定义
如下所示: name =
scrapy
.Field()
浏览 6
提问于2021-07-30
得票数 1
回答已采纳
1
回答
用烧瓶和刮水器进行交互式刮擦
、
、
、
简单地说,用户可以决定哪些项目应该报废,即项目应该被选择dynamically.Provide我有一些想法,我
如何
传递这些标签来设置在项目类别中要刮的项目?
浏览 1
提问于2015-08-18
得票数 0
回答已采纳
2
回答
python导入了没有名为zope.interface的模块扭曲
、
、
我安装了"
scrapy
“,但它给出了错误"importerror no module named zope.interface twisted".Please help me。 预先感谢.
浏览 1
提问于2010-12-21
得票数 5
回答已采纳
2
回答
将信息从
Scrapy
爬虫持续导出到Django应用程序数据库的最佳方法是什么?
、
、
、
我正在使用
Scrapy
框架执行抓取,虽然有一个实验性的,但我宁愿远离它,因为它是不稳定的。现在,我的计划是用
Scrapy
的XMLItemExporter (docs )创建爬行
项
的XML文件,并将这些文件作为XML (docs )使用到Django项目中。似乎没有人在网上写过这个过程,奇怪的是,在我看来,
Scrapy
是一个很好的框架,可以插入Django应用程序。实验DjangoItem的存在表明
Scrapy
+ Django是一个很受欢迎的选择,因此这里有一个很好的解决方案。 我非常感谢任何关于这个问题
浏览 3
提问于2011-07-29
得票数 6
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何用zabbix创建自定义监控项
使用scrapy和selenium实现动态网页的分页爬取
CAD定义块与动态块
scrapy如何顺序执行多个爬虫
php 如何定义函数,如何定义类
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券