开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何从多个文件夹读取到单个Dataframe

从多个文件夹读取到单个Dataframe可以通过以下步骤实现：

导入所需的库：import os import pandas as pd
定义一个函数来读取文件夹中的所有文件并将它们合并为一个Dataframe：def read_files(folder_path): files = os.listdir(folder_path) # 获取文件夹中的所有文件 df_list = [] # 存储每个文件的Dataframe for file in files: file_path = os.path.join(folder_path, file) # 构建文件路径 if os.path.isfile(file_path): # 确保路径指向一个文件而不是文件夹 df = pd.read_csv(file_path) # 读取文件内容为Dataframe df_list.append(df) # 将Dataframe添加到列表中 merged_df = pd.concat(df_list, ignore_index=True) # 合并所有Dataframe为一个 return merged_df
调用函数并传入包含多个文件夹路径的列表，将它们合并为一个Dataframe：folder_paths = ['folder1', 'folder2', 'folder3'] # 包含多个文件夹路径的列表 merged_df = pd.DataFrame() # 创建一个空的Dataframe用于存储合并结果 for folder_path in folder_paths: df = read_files(folder_path) # 读取文件夹中的所有文件并合并为一个Dataframe merged_df = merged_df.append(df, ignore_index=True) # 将当前Dataframe添加到合并结果中

这样，你就可以从多个文件夹中读取文件并将它们合并为一个单独的Dataframe了。

注意：以上代码假设文件夹中的文件都是以CSV格式存储的，如果文件格式不同，需要相应地修改读取文件的代码。另外，如果文件夹中的文件非常大，可能需要考虑分批读取和合并，以避免内存溢出的问题。

相关搜索:R:如何在R中将多个txt.gz文件读取到单个表中从多个源创建单个Spark Dataframe？从完整的txt文件文件夹创建多个或单个csv文件在databricks中使用pyspark将多个json文件从blob存储读取到dataframe 如何从dataframe pandas中删除多个标题行如何从dataframe获取单个项目列表如何从pandas Dataframe创建单个字典？如何从单个容器在单个页面上集成多个redux-forms 如何从多个数据集创建单个表？如何从多个文件创建单个dask数组？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

没有搜到相关的视频

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭