从数据帧的每个类别中迭代和采样可以通过以下步骤实现:
以下是一个示例代码,演示如何从数据帧的每个类别中迭代和采样:
import pandas as pd
# 读取数据帧
df = pd.read_csv('data.csv')
# 确定类别列
category_column = 'category'
# 获取类别列表
categories = df[category_column].unique()
# 迭代类别列表
for category in categories:
# 采样当前类别
sampled_data = df[df[category_column] == category].sample(n=10, replace=True)
# 处理采样结果,例如保存到新的数据帧或进行进一步的分析
# ...
在这个示例中,假设数据帧包含一个名为'category'的列,其中存储了不同的类别信息。代码将首先获取类别列表,然后使用for循环迭代每个类别。在每次迭代中,使用sample()函数对当前类别进行采样,采样数量为10。最后,可以根据需求对采样结果进行处理,例如保存到新的数据帧或进行进一步的分析。请根据实际情况进行适当的修改和调整。
serverless days
云+社区开发者大会(杭州站)
腾讯云GAME-TECH游戏开发者技术沙龙
云+社区技术沙龙[第27期]
T-Day
Elastic 中国开发者大会
云+社区技术沙龙[第9期]
云+社区沙龙online第5期[架构演进]
腾讯云培训认证中心开放日
领取专属 10元无门槛券
手把手带您无忧上云