在Pandas中,可以使用字典列表来创建新列,并通过循环遍历字典列表来填充数据框(DataFrame)。
首先,我们需要创建一个包含字典的列表。每个字典代表一行数据,其中键表示列名,值表示对应列的值。例如,我们创建一个包含姓名和年龄的字典列表:
data = [{'姓名': '张三', '年龄': 25},
{'姓名': '李四', '年龄': 30},
{'姓名': '王五', '年龄': 28}]
接下来,我们可以使用pd.DataFrame()
函数将字典列表转换为数据框:
import pandas as pd
df = pd.DataFrame(data)
现在,我们已经创建了一个包含姓名和年龄的数据框。如果我们想要在数据框中添加一个新列,可以使用以下语法:
df['新列名'] = 值
例如,我们想要添加一个名为“性别”的新列,并为每个人指定性别:
df['性别'] = ['男', '女', '男']
这样,我们就在数据框中成功添加了一个新列。
如果我们想要通过循环遍历字典列表来添加多个新列,可以使用iterrows()
方法来遍历数据框的每一行,并使用row
变量访问每一行的值。例如,我们想要根据年龄给每个人指定年龄段:
for index, row in df.iterrows():
if row['年龄'] < 30:
df.at[index, '年龄段'] = '青年'
else:
df.at[index, '年龄段'] = '中年'
在上述示例中,我们使用iterrows()
方法遍历数据框的每一行,并使用row
变量访问每一行的值。然后,我们使用条件语句根据年龄给每个人指定年龄段,并使用at
方法将年龄段值赋给新列。
这样,我们就成功地通过循环遍历字典列表在数据框中创建了新列。
腾讯云相关产品和产品介绍链接地址:
领取专属 10元无门槛券
手把手带您无忧上云