文章/答案/技术大牛

发布

社区首页 >问答首页 >Python逐行在dataframe上应用函数

问Python逐行在dataframe上应用函数
EN

Stack Overflow用户

提问于 2018-03-07 04:41:27

回答 3查看 36关注 0票数 1

当函数有其他参数时，我不明白在创建函数时应该如何使用"row“参数。我想创建一个函数来计算我的dataframe "file“中的新列。

这样做效果很好：

def imputation(row):    
    if  (row['hour_y']==0) & (row['outlier_idx']==True) :
        val=file['HYDRO'].mean()
    else : 
        val=row['HYDRO']
    return val

file['minute_corr'] = file.apply(imputation, axis=1)

但这不起作用(我添加了一个参数)：

def imputation(row,variable):    
    if  (row['hour_y']==0) & (row['outlier_idx']==True) :
        val=file[variable].mean()
    else : 
        val=row[variable]
    return val
file['minute_corr'] = file.apply(imputation(,'HYDRO'), axis=1)

pandas

dataframe

row

python

回答 3

Stack Overflow用户

发布于 2018-03-07 04:45:35

尝试这种矢量化方法：

file['minute_corr'] = np.where((file['hour_y']==0) & file['outlier_idx'],
                               file['HYDRO'].mean(),
                               file['HYDRO'])

票数 1

Stack Overflow用户

发布于 2018-03-07 05:13:41

使用apply函数，您还可以并行化计算。

file['minute_corr'] = file.apply(lambda row: (file['HYDRO'].mean() if (row['hour_y']==0) & (row['outlier_idx']==True) else row['HYDRO'] ), axis=1)

票数 0

Stack Overflow用户

发布于 2018-03-07 05:26:42

apply方法可以接受位置参数和关键字参数：

https://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.apply.html

最后一行try: Try：

file['minute_corr'] = file.apply(imputation,args=('HYDRO',), axis=1)

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/49139581

复制

相似问题

问Python逐行在dataframe上应用函数
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python逐行在dataframe上应用函数EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python逐行在dataframe上应用函数
EN