将Scrapy Python输出写入JSON文件

文章/答案/技术大牛

发布

3回答

、、、、

我是Python和web抓取的新手。在这个程序中，我想写的最终输出(产品名称和价格从所有3个链接)到JSON文件。请帮帮我！import scrapy import csv, os, json name = "spider1" def start_r

浏览 13提问于2019-05-27得票数 2

回答已采纳

2回答

Scrapy Json输出的Unicode

、、、、

json输出文件中的Unicode文本转义如下："\u00d6\u011fretmen S\u00fcleymanYurtta\u015fCad“。那么，有什么方法可以使scrapyjsonencoder编码器在写入文件时不转义。这是标准刮痕爬虫。抓取爬行--nolog -output=output.json -t json<

浏览 4提问于2015-06-19得票数 1

2回答

Scrapy :存储数据

、

我正在尝试遵循Scrapy教程，但我不理解的逻辑。scrapy crawl spidername -o items.json -t json scrapy crawl spidername --set FEED_URI=output.csv --set

浏览 4提问于2012-12-28得票数 14

回答已采纳

2回答

将结果从yield路由到一个文件

、

我有以下使用Scrapy的Python脚本： name = "site" self.log(next_page) yield scrapy.Request(next_page, callback'product_price':

浏览 0提问于2019-06-21得票数 0

1回答

S3存储桶的剪贴画:缺少1个必需的位置参数：“uri”

、

我正在尝试让scrapy将结果写入到S3存储桶中。我的配置文件中有以下内容： 'scrapy.pipelines.files.S3FilesStore': 1FEED_URI = 's3://1001-results-bucket/results.json'我的解析函数非常简单： cla

浏览 9提问于2018-02-14得票数 1

7回答

在Visual代码中调试Scrapy项目

、、、、

爬行器工作正常，但我想调试代码，为此我在我的launch.json文件中添加了以下内容： "name": "Scrapy with Integrated Terminal/Console","type": "python", "stopOnEntry": true, "pythonPath

浏览 1提问于2018-03-09得票数 23

回答已采纳

2回答

Scrapy -无法在项目位置之外保存已擦伤的数据。

、、

我是Python-Scrapy.的新手我无法弄清楚如何在项目之外保存被刮掉的输出文件(Project在Eclipse中)。我的项目结构是：这就是我如何运行我的刮刮项目：但是，我希望在运行时将该

浏览 2提问于2016-02-05得票数 1

1回答

Scrapyd:如何将数据写入json文件？

、、

我有一个正在运行的scrapy 2.1.0项目，其中我将数据写入json文件： self.file = open('data/'+datetime.datetime.now().strftime ("%Y%m%d") + '_' + spider.name + '.json', 'wb') self.e

浏览 2提问于2020-05-19得票数 0

2回答

使用scrapy将抓取的项目保存到json/csv/xml文件

、

crawl myspider用于在文件中获取结果的scrapy crawl myspider -o item.json我的问题是，只有当scrapy完成抓取时，scrapy才会将抓取的结果转储到item.json。意味着要等到爬行结束。因此，对于大型项目，我将不得不等待非常非常长的时间，因为我猜scrapy将在所有爬行

浏览 2提问于2014-02-04得票数 4

1回答

同时运行相同的爬虫

、、

我使用的是scrapy 0.20和python 2.7请注意，我使用的是管道，以便将结果写入json文件。谢谢

浏览 1提问于2014-02-25得票数 1

1回答

一次运行Scrapy脚本，处理输出，并加载到数据库？

、

我已经成功地编写了一个从网页抓取数据的Scrapy项目，当我在命令行使用scrapy crawl dmoz -o items.json -t json调用它时，它成功地将抓取的数据输出到JSON文件中。然后，我编写了另一个脚本，获取该JSON文件，加载它，更改数据的组织方式(我不喜欢它的默认组织方式)，并将其作为第二个JSON文件输出。然后使用Django的man

浏览 0提问于2013-02-03得票数 1

回答已采纳

1回答

php shell_exec() - ampps -拒绝scrapy命令的权限

、、、

我已经在php和html中开发了一个ui，以显示在运行scrapy命令时从正在生成的json文件中获取被刮掉的data.this数据。iam使用ampps来运行php。-o example.json 2>&1');我得到的结果是'scrapy命令找不到‘。-o example.json 2>&1');现在我得到了包含消息的输出 Permi

浏览 0提问于2019-03-21得票数 1

回答已采纳

1回答

如何将项转换为JSON字符串，以便将项导出到S3

、

我正在编写自己的Scrapy项目管道，以便将单个JSON文件输出到S3中。到目前为止，这是我的代码，但我无法解决如何将每个项序列化为JSON。(item) File "/usr/local/Cellar/python/2.7.13/Frameworks/Python.framework/Versions/2.7/lib&#

浏览 2提问于2017-01-01得票数 1

回答已采纳

3回答

如何在Scrapy* Spider完成后触发Mongodb导入？*

、、、、

我正在使用Python库Scrapy来抓取网站并定期生成json输出文件。为了提高效率，我希望在每个爬行器完成后将这些json文件批量上传到Mongodb中。我相信我可以这样做：然而，我想知道在爬虫完成后触发这个导入的最好方法是什么我希望我可以使用这里描述的close_spide

浏览 0提问于2018-09-23得票数 0

1回答

Scrapy:如何将爬行统计数据保存到json文件？

、

在scrapy 2.0.1中，我将新数据写入到json文件中。在这个过程的最后，我想附加一些粗略的统计数据。现在我知道有一个scrapy stats集合可用： https://docs.scrapy.org/en/latest/topics/stats.html 所以正确的代码行可能是下面这一行：stats.get_statstest_pipeline(object):

浏览 18提问于2020-04-24得票数 3

2回答

将数据放在CSV文件中，从爬虫抓取不同的网站(Scrapy)

、、

但是现在我似乎不能将数据放入一个普通的csv或json文件中。在我组合爬虫之前，我只需要抓取afg2 -o数据_set.csv'，但现在似乎不起作用。获取csv文件中的数据的最简单方法是什么？下面是我的代码： import scrapy

浏览 44提问于2020-07-23得票数 0

回答已采纳

5回答

在脚本文件函数中获取Scrapy* crawler输出/结果*

、、、、

我使用脚本文件在scrapy项目中运行爬行器，并且爬行器记录爬虫的输出/结果。但是我想在脚本文件中使用爬行器输出/结果，在某些函数中，.I不想将输出/结果保存在任何文件或DB中。下面是从获取的脚本代码from scrapy.crawler import CrawlerRunner from scrapy.utils.logimpo

浏览 3提问于2016-10-25得票数 12

1回答

从单独的脚本运行Scrapy -o JSON

、、、

我有一个python3脚本，我在其中调用了2个抓取爬行器，以便在代码中的某个时刻输出一个JSON文件。目前，我通过运行如下所示的bat脚本来做到这一点：Bat脚本：scrapy crawl proje

浏览 20提问于2020-07-30得票数 1

回答已采纳

7回答

如何保存Scrapy* crawl命令输出*

、

我正在尝试保存scrapy crawl命令的输出，我已经尝试过scrapy crawl someSpider -o some.json -t json >> some.text，但它不起作用，有人告诉我如何将输出保存到文本文件中...我的意思是通过scrapy打印的日志和信息……我正在尝试保存scrapy crawl命令的输出，但它不起作用。

浏览 5提问于2013-05-20得票数 12

回答已采纳

1回答

哪些文件的名称来自结果dir(scrapy)命令？

、

定义和语句的文件。因此，我尝试查找scrapy文件来查看内部的定义名称：/usr/local/lib/python2.7/dist-packages/scrapy/usr/local/lib/python2.7/dist-packages/scrapy

浏览 0提问于2018-07-28得票数 0

回答已采纳

点击加载更多