我有一个Pandas Panel,它有许多具有相同行/列标签的DataFrames。我想用DataFrames制作一个新的面板,它基于几个列来满足特定的标准。
这对于数据帧和行来说很简单:假设我有一个df,zHe_compare。我可以使用以下命令获取合适的行:
zHe_compare[(zHe_compare['zHe_calc'] > 100) & (zHe_compare['zHe_med'] > 100) | ((zHe_obs_lo_2s <=zHe_compare['zHe_calc']) & (zHe_compare['zHe_calc'] <= zHe_obs_hi_2s))]但是我该怎么做(伪代码,简化的布尔值):
good_results_panel = results_panel[ all_dataframes[ sum ('zHe_calc' < 'zHe_obs') > min_num ] ]我知道内部的布尔值部分,但我如何为面板中的每个数据帧指定它?因为我需要来自每个df的多个列,所以我还没有成功地使用panel.minor_xs切片技术。
谢谢!
发布于 2013-03-24 18:40:38
正如在其documentation中提到的,Panel目前有点开发不足,所以您在使用DataFrame时所依赖的语法还没有出现。
同时,我建议使用Panel.select方法:
def is_good_result(item_label):
# whatever condition over the selected item
df = results_panel[item_label]
return df['col1'].sum() > 5
good_results = results.select(is_good_result)is_good_result函数返回一个布尔值。请注意,它的参数不是DataFrame实例,因为Panel.select将其参数应用于项标签,而不是该项的DataFrame内容。
当然,如果你对简洁性感兴趣,你可以在一条语句中把整个标准函数塞进一个lambda中:
good_results = results.select(
lambda item_label: results[item_label]['col1'].sum() > 5
)https://stackoverflow.com/questions/13505843
复制相似问题