从数据帧的每个类别中迭代和采样可以通过以下步骤实现:
以下是一个示例代码,演示如何从数据帧的每个类别中迭代和采样:
import pandas as pd
# 读取数据帧
df = pd.read_csv('data.csv')
# 确定类别列
category_column = 'category'
# 获取类别列表
categories = df[category_column].unique()
# 迭代类别列表
for category in categories:
# 采样当前类别
sampled_data = df[df[category_column] == category].sample(n=10, replace=True)
# 处理采样结果,例如保存到新的数据帧或进行进一步的分析
# ...
在这个示例中,假设数据帧包含一个名为'category'的列,其中存储了不同的类别信息。代码将首先获取类别列表,然后使用for循环迭代每个类别。在每次迭代中,使用sample()函数对当前类别进行采样,采样数量为10。最后,可以根据需求对采样结果进行处理,例如保存到新的数据帧或进行进一步的分析。请根据实际情况进行适当的修改和调整。
领取专属 10元无门槛券
手把手带您无忧上云