将多个表解析为一个数据帧可以通过以下步骤实现:
import pandas as pd
df1 = pd.read_csv('table1.csv')
df2 = pd.read_excel('table2.xlsx')
df3 = pd.read_json('table3.json')
# 删除重复值
df1 = df1.drop_duplicates()
# 处理缺失值
df2 = df2.fillna(0)
# 更改数据类型
df3['date'] = pd.to_datetime(df3['date'])
# 使用merge方法根据共同的列进行合并
merged_df = pd.merge(df1, df2, on='id')
# 使用concat方法按行或列进行合并
merged_df = pd.concat([df1, df2, df3], axis=0)
# 筛选特定行
filtered_df = merged_df[merged_df['category'] == 'A']
# 计算统计指标
mean_value = merged_df['value'].mean()
# 应用函数
merged_df['new_column'] = merged_df['column1'].apply(lambda x: x*2)
# 输出为CSV文件
merged_df.to_csv('merged_data.csv', index=False)
# 输出为Excel文件
merged_df.to_excel('merged_data.xlsx', index=False)
腾讯云相关产品和产品介绍链接地址:
领取专属 10元无门槛券
手把手带您无忧上云