要处理多个Excel文件,添加列,并将它们绑定在一起,可以使用Python中的pandas库。以下是详细步骤和相关概念:
.xls
和.xlsx
。以下是一个示例代码,展示了如何读取多个Excel文件,添加列,并将它们绑定在一起:
import pandas as pd
import os
# 定义文件路径和输出文件路径
file_paths = ['file1.xlsx', 'file2.xlsx', 'file3.xlsx']
output_file = 'combined_output.xlsx'
# 初始化一个空的DataFrame
combined_df = pd.DataFrame()
# 遍历每个文件路径
for file_path in file_paths:
# 读取Excel文件
df = pd.read_excel(file_path)
# 添加新列(示例:添加一个名为'Source'的列,值为文件名)
df['Source'] = os.path.basename(file_path)
# 将当前DataFrame追加到combined_df中
combined_df = pd.concat([combined_df, df], ignore_index=True)
# 将最终的DataFrame保存到新的Excel文件中
combined_df.to_excel(output_file, index=False)
print(f"Combined data has been saved to {output_file}")
.xls
或.xlsx
格式。通过以上步骤和方法,可以有效地处理多个Excel文件,添加所需列,并将它们绑定在一起。
领取专属 10元无门槛券
手把手带您无忧上云