首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >保存在csv文件中的抓取数据不会转换为excel(xlsx)文件。

保存在csv文件中的抓取数据不会转换为excel(xlsx)文件。
EN

Stack Overflow用户
提问于 2018-07-26 23:51:37
回答 1查看 224关注 0票数 0

这是网页抓取的代码,并将保存的抓取数据从csv格式转换为".xlsx“文件。

当我使用命令行- scrapy crawl spider_name -o file_name.csv从抓取数据到csv格式中提取数据来运行此代码时,项目文件夹中将不会生成excel文件。没有错误信息。请建议如何摆脱这种未知的麻烦。

代码语言:javascript
代码运行次数:0
运行
复制
import os
import scrapy
import csv
import glob
from openpyxl import Workbook

class QuotesSpider(scrapy.Spider):
    name = "quotes"
    allowed_domains = ["quotes.toscrape.com"]
    start_urls = (
        'http://quotes.toscrape.com/',
    )

    def parse(self, response):
        h1_tag = response.xpath('//h1/a/text()').extract_first()
        tags = response.xpath('//*[@class="tag-item"]/a/text()').extract()

        yield {'H1 Tag': h1_tag, 'Tags': tags}

    def close(self, reason):
        csv_file = max(glob.iglob("*.csv"), key=os.path.getctime)

        wb = Workbook()
        ws = wb.active

        with open(csv_file, 'r') as f:
            for row in csv.reader(f):
                ws.append(row)

        wb.save(csv_file.replace('.csv', '') + '.xlsx')
EN

回答 1

Stack Overflow用户

发布于 2018-07-27 14:25:53

尝试执行以下命令:

代码语言:javascript
代码运行次数:0
运行
复制
 scrapy crawl <spider name> -o file.csv -t csv
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51542959

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档