首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >Python/Pandas Dataframe用中值替换0

Python/Pandas Dataframe用中值替换0
EN

Stack Overflow用户
提问于 2016-05-29 13:21:27
回答 3查看 44.6K关注 0票数 12

我有一个python pandas数据帧,它有几列,其中一列有0值。我想用此列的medianmean替换0值。

data是我的数据帧

artist_hotness是该列

代码语言:javascript
复制
mean_artist_hotness = data['artist_hotness'].dropna().mean()

if len(data.artist_hotness[ data.artist_hotness.isnull() ]) > 0:
data.artist_hotness.loc[ (data.artist_hotness.isnull()), 'artist_hotness'] = mean_artist_hotness

我试过了,但它不起作用。

EN

回答 3

Stack Overflow用户

发布于 2016-05-29 13:53:32

使用pandas replace方法:

代码语言:javascript
复制
df = pd.DataFrame({'a': [1,2,3,4,0,0,0,0], 'b': [2,3,4,6,0,5,3,8]}) 

df 
   a  b
0  1  2
1  2  3
2  3  4
3  4  6
4  0  0
5  0  5
6  0  3
7  0  8

df['a']=df['a'].replace(0,df['a'].mean())

df
   a  b
0  1  2
1  2  3
2  3  4
3  4  6
4  1  0
5  1  5
6  1  3
7  1  8
票数 15
EN

Stack Overflow用户

发布于 2016-05-29 14:14:02

代码语言:javascript
复制
data['artist_hotness'] = data['artist_hotness'].map( lambda x : data.artist_hotness.mean() if x == 0 else x)
票数 1
EN

Stack Overflow用户

发布于 2018-06-20 05:27:36

我发现这些非常有用,尽管mask非常慢(不知道为什么)。

我这样做了:

代码语言:javascript
复制
df.loc[ df['artist_hotness'] == 0 | np.isnan(df['artist_hotness']), 'artist_hotness' ] = df['artist_hotness'].median()
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37506488

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档