我有一个很大的文件,大约35 of,以hdf5的形式存储。我必须在一些特定的列上进行某些计算,并希望将这些计算作为新列插入。我知道我可以将新列直接赋值为
df['new_column'] = 0(or some other value)。但是我有一些计算,其中我必须使用以前的行值。在pandas中,我们可以使用iloc函数来获取前一个索引的值。但是,熊猫
我有一个包含数字和NaNs列的数据集。我想要创建一个新的虚拟变量列,以便进一步计算。显然有些地方不对劲,因为不管我做什么,假人都是1。import pandas as pdall_air = pd.read_csv('small.csv')
#all_air['C'].fillna(-1) #pandas will take N