我有一个200k行的数据框,我尝试在其他行的基础上添加列,但有一些条件。我试着实现它,但花了很多时间(2个小时)。下面是我的代码: for index in dataset.index: B_id = dataset.loc[indexdataset.at[index, 'D_mean'] = subset['D'].mean(
使用Python3和Anaconda,我在ipython上导入了pandas和os。我有一个非常大的csv文件。在对文件使用read_csv之后,我尝试对两列使用.groupby(),但它将数据类型从DataFrame更改为DataFrameGroupBy,并且我不能再对其运行数据框方法。我想不出任何可以尝试的东西。我对熊猫的经验很少,通过codecademy获得的。我的代码似乎可以在那里工作。import os
import pandas as pd