Scrapy输出空的JSON / CSV文件_Scrapy spider输出空csv文件_Scrapy中的空.json文件 - 腾讯云开发者社区

python、scrapy

我正在尝试遵循Scrapy教程，但我不理解的逻辑。scrapy crawl spidername -o items.json -t json 我不明白以下的意思：谢谢你的帮助

浏览 4提问于2012-12-28得票数 14

回答已采纳

1回答

使用scrapy在csv文件中逐行写入一个元素

python、csv、web-scraping、scrapy、yield

我正在抓取这个页面：我想将其保存在CSV文件中，其中每行包含一部电影的记录。这是我写的蜘蛛： name = 'movies_spider' data[key] = (v

浏览 2提问于2016-08-08得票数 0

1回答

Scrapy输出空的JSON / CSV文件

python、scrapy

我对scrapy和python非常陌生，真的需要一些帮助。我已经让这段代码在命令行中工作了。我可以看到它在浏览不同的页面时提取了所有正确的信息。我的问题是，当我试图将脚本的输出保存到一个文件中时，它是空的。我已经在这里看了很多其他问题，但找不到任何有帮助的东西。以下是代码 import scrapy class Aberdeenlocat

浏览 49提问于2020-04-30得票数 0

回答已采纳

3回答

Scrapy:覆盖以前导出文件的命令

python、scrapy、export、overwrite

设置导出新的spider_output.csv时，Scrapy将其附加到现有的spider_output.csv中。我能想到两种解决方案，

浏览 18提问于2017-04-25得票数 3

回答已采纳

1回答

Scrapinghub在日志中插入我的结果，而不是在项目中。

json、scrapy、scrapy-spider、scrapy-pipeline、scrapinghub

我有一个有效的蜘蛛项目来提取urls内容(没有css)。我抓取了几组数据，并将它们存储在一系列.csv文件中。现在，我试着将它设置为在Scrapinghub上工作，以便进行长时间的刮刮。到目前为止，我能够得到蜘蛛上传和工作的剪贴。我的问题是结果出现在“日志”中，而不是在“项”下。数据量超过了日志容量，因此给出了一个错误。如何将管道/提取器设置为工作并返回js或csv文件？我很高兴有一个解决方案，将刮掉的数据发送到数据库。因为

浏览 2提问于2019-02-28得票数 2

1回答

如何将爬行器的项目附加到列表中？

python、macos、list、scrapy

我正在使用一种基本的蜘蛛，从网站上的链接中获取特定的信息。我的代码如下所示：from scrapy import Requestfrom properties importPropertiesItem, ItemLoader class BasicSpider(scrapy.Spider&

浏览 1提问于2017-01-04得票数 0

回答已采纳

3回答

Scrapy spider输出空csv文件

python、csv、web-scraping、scrapy、scrapy-spider

这是我在这里的第一个问题，我正在学习如何自己编写代码，所以请耐心等待。我正在做一个最终的CS50项目，我试图建立一个网站，聚合从edx.org和其他开放的在线堂兄弟网站可能在线西班牙语课程。我正在使用scrapy框架在edx.org上删除西班牙语课程的过滤结果...这是我的第一个抓取爬虫，我试图在每个课程链接中获取它的名称(在我获得正确的代码后，还可以获得描述、课程url和更多内容)。from scrapy.item import

浏览 52提问于2018-01-03得票数 3

2回答

在scrapy中从多个文件中刮取多个地址

python、json、file、scrapy

我在目录中有一些JSON文件。在任何这些文件中，我都需要一些信息。我需要的第一个属性是"start_urls“的链接列表。我该怎么做？到目前为止，我的代码

浏览 2提问于2018-01-05得票数 1

回答已采纳

1回答

关于爬行器设置、蜘蛛设置、项目设置的混淆

python、scrapy

我对爬虫设置、蜘蛛设置、settings.py和项目设置感到困惑，我在函数中看到了关于刮伤的文档，而我还没有理解difference.For示例 "FEEDS": { },区别是什么，以及如何使用它们。对不起我的英语不好。我想知道them.and之间的</e

浏览 7提问于2022-11-23得票数 1

1回答

我试图将我的刮伤结果输出到csv文件，但是输出始终是空的

python、csv、cmd、scrapy

这是我的主要蜘蛛bathuni.pyfrom scrapy.selector import Selector country = site.xpath('text()').extract()我的items.py如下所示 from scrapy.item import

浏览 7提问于2014-02-26得票数 1

回答已采纳

1回答

无法为scrapy* xpath生成输出*

python、xpath、scrapy

我绝对是个生手，这是我第一次问StackOverflow问题，所以在这里请原谅我，我试图从一个网站的表中提取数据，该表包含在一个<span>标记中。当我使用scrapy shell (新冠肺炎情况报告摘要表的值)时，我成功地获得了正确的输出，但是我无法将输出复制到json/csv文件中。我尝试过常规的start_urls (第8行)，但面临空输出的<

浏览 1提问于2022-09-30得票数 -2

3回答

Python/Scrapy:如何确定页面是否为html？

python、html、scrapy

因此，如果它遇到一个pdf文件，它将把响应通过一个PDFReader，否则它将读取html文件的原样。self, response): return ct 我将蜘蛛的结果输出到一个.csv文件中，但始终是空的。只让ct = response.headers<

浏览 1提问于2018-09-23得票数 0

回答已采纳

2回答

刮擦未保存数据

python-2.7、scrapy

# -*- coding: utf-8 -*-from scrapy.spidersimport Cr

浏览 2提问于2017-02-27得票数 0

回答已采纳

2回答

Scrapyd:将CSV文件写入远程服务器

python、scrapy、scrapyd

我试图在EC2上安排一个爬虫，并将输出导出到csv文件cppages-nov.csv，同时创建一个作业包--我需要暂停爬行，但它没有创建任何文件。我用的是正确的饲料出口吗？curl http://awsserver:6800/schedule.json -d project=wallspider -d spider=cppages -d JOBDIR=/home/ubuntu/scra

浏览 0提问于2014-09-26得票数 1

回答已采纳

3回答

如何在每次导出刮伤项时启用覆写文件？

python、csv、scrapy、scrapy-spider、scrapy-pipeline

我正在刮一个在urls列表中返回的网站。示例- scrapy crawl xyz_spider -o urls.csv 现在它运行得非常好，我想要的是使新的urls.csv不再将data添加到文件中。

浏览 4提问于2016-10-30得票数 1

回答已采纳

1回答

python scrapy* -输出csv文件为空*

python、web-scraping、scrapy、export-to-csv

我的主要爬虫代码：from scrapy.selector import HtmlXPathSelector print name, MSRP, Sale

浏览 3提问于2013-07-06得票数 4

回答已采纳

1回答

Python产量不起作用，但是print()

python、web-scraping、scrapy

在运行爬虫时，使用print()至少会输出如下结果：但是，output.csv的格式不是很好。但是，在这种情况下，输出的CSV/JSON是空的。这是我的蜘蛛代码from sc

浏览 1提问于2021-03-04得票数 0

回答已采纳

1回答

抓取-在抓取和随机更改用户代理时访问数据

python、web-crawler、scrapy

我有一个脚本，它找到一个特定的关键字，并在.csv中写入关键字以及找到它的链接。但是，我必须等待抓取完成爬行，当完成时，它将实际输出.csv文件中的数据。#!/usr/bin/env pythonfrom scrapy.

浏览 1提问于2015-12-02得票数 0

回答已采纳

1回答

如何停止Scrapy编译Scrapy项目中的所有python文件

python、csv、scrapy

对于一个scrapy项目，我开发了多个爬行器，并将它们存储在同一个爬行器文件夹中。我使用以下命令通过cmd运行所有的抓取器: scrapy crawl spidername 然而，我注意到它遵守了项目或文件夹中的所有爬虫，尽管它们存储在不同的python文件中，具有不同的文件名，不同的爬行器名称，不同的类名和不同的输出名称。我注意到这种情况的发生

浏览 0提问于2015-01-12得票数 0

5回答

如何使用py文件运行scrapy

python、scrapy

嗨，我在scrapy上工作，我用scrapy startproject example创建了一个scrapy文件夹，并编写了爬行器来抓取url中的所有数据，我已经使用scrapy crawl spider_name但是我有一个要求，我需要用创建的单个爬虫文件运行scrapy，我的意思是单个py文件，类似于 python -u /path/to/spider_file_i

浏览 1提问于2012-09-29得票数 8

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Scrapy :存储数据

使用scrapy在csv文件中逐行写入一个元素

Scrapy输出空的JSON / CSV文件

Scrapy:覆盖以前导出文件的命令

Scrapinghub在日志中插入我的结果，而不是在项目中。

如何将爬行器的项目附加到列表中？

Scrapy spider输出空csv文件

在scrapy中从多个文件中刮取多个地址

关于爬行器设置、蜘蛛设置、项目设置的混淆

我试图将我的刮伤结果输出到csv文件，但是输出始终是空的

无法为scrapy* xpath生成输出*

Python/Scrapy:如何确定页面是否为html？

刮擦未保存数据

Scrapyd:将CSV文件写入远程服务器

如何在每次导出刮伤项时启用覆写文件？

python scrapy* -输出csv文件为空*

Python产量不起作用，但是print()

抓取-在抓取和随机更改用户代理时访问数据

如何停止Scrapy编译Scrapy项目中的所有python文件

如何使用py文件运行scrapy

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐