首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

pandas递归read_csv,同时向每个添加列

Pandas是一个开源的数据分析和处理库,递归read_csv是指通过递归的方式读取多个CSV文件,并将它们合并为一个数据框。

在进行pandas递归read_csv操作时,可以使用递归函数来实现读取多个CSV文件并合并的过程。以下是一个示例代码:

代码语言:txt
复制
import os
import pandas as pd

def recursive_read_csv(directory):
    dfs = []  # 存储每个CSV文件的数据框
    
    for filename in os.listdir(directory):
        if filename.endswith('.csv'):
            filepath = os.path.join(directory, filename)
            df = pd.read_csv(filepath)
            dfs.append(df)
            
            # 判断是否有子目录,如果有则递归调用该函数
            if os.path.isdir(filepath):
                dfs.extend(recursive_read_csv(filepath))
    
    merged_df = pd.concat(dfs, axis=1)  # 将所有数据框按列合并
    
    return merged_df

在该示例代码中,首先定义了一个递归函数recursive_read_csv,该函数接受一个目录路径作为参数。然后,通过遍历目录下的文件和子目录,判断是否为CSV文件,如果是则读取该文件的数据框,并添加到一个列表中。如果遇到子目录,则递归调用recursive_read_csv函数读取子目录下的CSV文件,并将它们合并到列表中。最后,使用pd.concat函数按列合并所有的数据框,得到最终的合并结果。

这种递归读取和合并CSV文件的方法适用于文件层级结构相同且需要合并的情况,比如多个子目录下都有相同结构的CSV文件,可以将它们递归地合并为一个数据框,便于后续的数据分析和处理。

推荐的腾讯云相关产品:腾讯云对象存储(COS)

腾讯云对象存储(COS)是一种安全、高可靠、低成本的云端存储服务,适用于存储大量非结构化数据,包括图片、音视频、备份、存档等。您可以通过腾讯云对象存储(COS)将读取的CSV文件存储在云端,并在需要时进行访问和管理。

了解更多关于腾讯云对象存储(COS)的信息,请访问:腾讯云对象存储(COS)产品介绍

注意:以上答案仅代表本人观点,不涉及任何云计算品牌商。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

没有搜到相关的合辑

领券