开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

读取多个CSV并根据文件名python中的年份将这些CSV合并到单独的文件中

在Python中，可以使用pandas库来读取和合并多个CSV文件。下面是一个完善且全面的答案：

CSV文件是一种常用的数据存储格式，它以逗号作为字段的分隔符，每行表示一条记录。在某些情况下，我们可能需要读取多个CSV文件并将它们合并到单独的文件中，同时根据文件名中的年份进行分类。

首先，我们需要导入pandas库来处理CSV文件。可以使用以下代码进行导入：

import pandas as pd

接下来，我们需要获取所有CSV文件的文件名，并根据年份进行分类。可以使用以下代码来实现：

import os

# 获取当前目录下所有的CSV文件
csv_files = [file for file in os.listdir('.') if file.endswith('.csv')]

# 创建一个字典来存储按年份分类的CSV数据
csv_data = {}

# 遍历所有CSV文件
for file in csv_files:
    # 提取文件名中的年份信息
    year = file.split('.')[0][-4:]
    
    # 读取CSV文件数据
    data = pd.read_csv(file)
    
    # 将数据存储到字典中对应的年份键下
    if year in csv_data:
        csv_data[year].append(data)
    else:
        csv_data[year] = [data]

现在，我们已经将CSV数据按照年份分类存储在了字典csv_data中。接下来，我们可以将每个年份的数据合并到单独的文件中。可以使用以下代码来实现：

# 遍历按年份分类的CSV数据
for year, data_list in csv_data.items():
    # 合并数据
    merged_data = pd.concat(data_list)
    
    # 将合并后的数据保存到单独的文件中
    merged_data.to_csv(f'{year}_merged.csv', index=False)

以上代码将按年份分类的CSV数据合并并保存到以年份命名的文件中，文件名格式为年份_merged.csv。

总结一下，通过使用pandas库，我们可以轻松地读取多个CSV文件并根据文件名中的年份将它们合并到单独的文件中。这种方法适用于需要对大量CSV数据进行处理和分析的场景。

推荐的腾讯云相关产品：腾讯云对象存储（COS），它提供了高可靠、低成本的对象存储服务，适用于存储和处理大规模的非结构化数据。您可以通过以下链接了解更多关于腾讯云对象存储的信息：腾讯云对象存储（COS）

请注意，以上答案中没有提及亚马逊AWS、Azure、阿里云、华为云、天翼云、GoDaddy、Namecheap、Google等流行的云计算品牌商。

相关搜索:Python + CSV + xlsx + Pandas :将多个CSV文件合并到一个多页CSV中 python中的networkx读取csv文件 Python读取csv文件中的3列使用pandas将多个csv文件读取到单独的数据帧中使用python将多个CSV文件合并到一个头文件相同但文件名不同的csv文件中。匹配CSV文件中的文件名，然后将这些文件移动到新目录单独使用文件夹中的多个CSV并保存其名称在Python中读取csv文件中的数据在python中读取CSV文件并写入新的CSV文件如何使用python删除csv文件中的这些字符？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Python统计汇总Grafana导出的csv文件到Excel

原始文件是多个csv表格，第一列为时间戳，每10分钟统计生成一行，其余列为ip地址在该时间段内的访问次数

02

干货：手把手教你用Python读写CSV、JSON、Excel及解析HTML

导读：本文要介绍的这些技法，会用Python读入各种格式的数据，并存入关系数据库或NoSQL数据库。

02

如何快速学会Python处理数据？（5000字走心总结）

很多同学抱怨自己很想学好Python，但学了好久，书也买不少，视频课程也看了不少，但是总是学了一段时间，感觉还是没什么收获，碰到问题没思路，有思路写不出多少行代码，遇到报错时也不知道怎么处理。

02

6个提升效率的pandas小技巧

文章来源：towardsdatascience 作者：B.Chen 翻译\编辑：Python大数据分析

02

6个提升效率的pandas小技巧

pandas中的read_clipboard()方法非常神奇，可以把剪切板中的数据变成dataframe格式，也就是说直接在excel中复制表格，可以快速转化为dataframe。

02

给数据科学家的10个提示和技巧Vol.3

原文：10 Tips And Tricks For Data Scientists Vol.3[1]

04

Pandas 25 式

原文的数据集是 bit.ly 短网址的，我这里在读取时出问题，不稳定，就帮大家下载下来，统一放到了 data 目录里。

00

Python3分析CSV数据

with语句在语句结束时自动关闭文件对象。使用csv模块reader函数创建文件读取对象filereader，读取输入文件中的行。使用csv模块的writer函数创建文件写入对象filewriter，将数据写入输出文件。函数的第二个参数（delimiter=','）是默认分隔符，如果输入和输出文件都用逗号分隔，就不需要此参数。使用filewriter对象的writerow函数来将每行中的列表值写入输出文件。

01

数据分析与数据挖掘 - 07数据处理

Pandas是数据处理中非常常用的一个库，是数据分析师、AI的工程师们必用的一个库，对这个库是否能够熟练的应用，直接关系到我们是否能够把数据处理成我们想要的样子。Pandas是基于NumPy构建的，让以NumPy为中心的应用变得更加的简单，它专注于数据处理，这个库可以帮助数据分析、数据挖掘、算法等工程师岗位的人员轻松快速的解决处理预处理的问题。比如说数据类型的转换，缺失值的处理、描述性统计分析、数据汇总等等功能。它不仅仅包含各种数据处理的方法，也包含了从多种数据源中读取数据的方法，比如Excel、CSV等，这些我们后边会讲到，让我们首先从Pandas的数据类型开始学起。 Pandas一共包含了两种数据类型，分别是Series和DataFrame，我们先来学习一下Series类型。 Series类型就类似于一维数组对象，它是由一组数据以及一组与之相关的数据索引组成的，代码示例如下：

02

Python数据分析实战之数据获取三大招

一个数据分析师，最怕的一件事情莫过于在没有数据的情况下，让你去做一个详细的数据分析报告。确实，巧妇难为无米之炊，数据是数据分析、数据挖掘乃至数据可视化最最基础的元素。

02

史上最全！用Pandas读取CSV，看这篇就够了

导读：pandas.read_csv接口用于读取CSV格式的数据文件，由于CSV文件使用非常频繁，功能强大，参数众多，因此在这里专门做详细介绍。

08

数据分析篇 | PyCon 大咖亲传 pandas 25 式，长文建议收藏

Kevin Markham，数据科学讲师，2002 年，毕业于范德堡大学，计算机工程学士，2014 年，创建了 Data School，在线教授 Python 数据科学课程，他的课程主要包括 Pandas、Scikit-learn、Kaggle 竞赛数据科学、机器学习、自然语言处理等内容，迄今为止，浏览量在油管上已经超过 500 万次。

02

数据处理技巧 | glob - 被忽略的超强文件批量处理模块

本篇推文开始，我将介绍一些常用的Python数据处理小技巧，帮助大家更好的处理数据，提高工作效率。今天我将介绍Python自带的一个模块-glob模块。涉及的内容主要如下：

03

让机器听声音识别男女（机器学习的方法）

注：该文件主要是用来构造训练过程中的特征文件，需要人为的标定male或者female。对生成的male.csv和female.csv文件再合并成为train.csv文件，用于训练。

05

12种用于Python数据分析的Pandas技巧

本文将介绍12种用于数据分析的Pandas技巧，为了更好地描述它们的效果，这里我们用一个数据集辅助进行操作。

02

从小白到大师，这里有一份Pandas入门指南

在阅读本文时，我建议你阅读每个你不了解的函数的文档字符串（docstrings）。简单的 Google 搜索和几秒钟 Pandas 文档的阅读，都会使你的阅读体验更加愉快。

03

从小白到大师，这里有一份Pandas入门指南

在阅读本文时，我建议你阅读每个你不了解的函数的文档字符串（docstrings）。简单的 Google 搜索和几秒钟 Pandas 文档的阅读，都会使你的阅读体验更加愉快。

03

从小白到大师，这里有一份Pandas入门指南

在阅读本文时，我建议你阅读每个你不了解的函数的文档字符串（docstrings）。简单的 Google 搜索和几秒钟 Pandas 文档的阅读，都会使你的阅读体验更加愉快。

01

统计师的Python日记【第5天：Pandas，露两手】

本文是【统计师的Python日记】第5天的日记回顾一下：第1天学习了Python的基本页面、操作，以及几种主要的容器类型；第2天学习了python的函数、循环和条件、类。第3天了解了Numpy这个工具库。第4天初步了解了Pandas这个库原文复习（点击查看）：第1天：谁来给我讲讲Python？第2天：再接着介绍一下Python呗【第3天：Numpy你好】【第4天：欢迎光临Pandas】【第四天的补充】今天将带来第5天的学习日记。目录如下：前言一、描述性统计 1. 加总 2

07

一文综述python读写csv xml json文件各种骚操作

Python优越的灵活性和易用性使其成为最受欢迎的编程语言之一，尤其是对数据科学家而言。这在很大程度上是因为使用Python处理大型数据集是很简单的一件事情。

05

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭