我有一个数据帧
import pandas as pd
import numpy as np
df = pd.DataFrame(np.nan, index=range(1,19), columns=['A','B','C','D','E','F','G','H'])
a = [1550, 41, 9.41, 22.6, 4.74, 3.2, 11.64, 2.23]
b = [1540, 43, 9.41, 22.3, 4.84, 3.12, 11.64, 2.23]
c = [1590, 39, 9.41, 23.7, 4.74, 3.0, 11.64, 2.23]
d = [1540, 41, 9.41, 22.5, 4.74, 3.2, 11.64, 2.23]
e = [1580, 32, 9.27, 22.8, 4.82, 2.7, 12.2, 2.50]
f = [1550, 30, 9.00, 20, 4.50, 2.5, 10, 2.00]
df.loc[[1,8,13,15,16,18],:] = [a,b,c,d,e,f]
看起来像这样
A B C D E F G H
1 1550.0 41.0 9.41 22.6 4.74 3.20 11.64 2.23
2 NaN NaN NaN NaN NaN NaN NaN NaN
3 NaN NaN NaN NaN NaN NaN NaN NaN
4 NaN NaN NaN NaN NaN NaN NaN NaN
5 NaN NaN NaN NaN NaN NaN NaN NaN
6 NaN NaN NaN NaN NaN NaN NaN NaN
7 NaN NaN NaN NaN NaN NaN NaN NaN
8 1540.0 43.0 9.41 22.3 4.84 3.12 11.64 2.23
9 NaN NaN NaN NaN NaN NaN NaN NaN
10 NaN NaN NaN NaN NaN NaN NaN NaN
11 NaN NaN NaN NaN NaN NaN NaN NaN
12 NaN NaN NaN NaN NaN NaN NaN NaN
13 1590.0 39.0 9.41 23.7 4.74 3.00 11.64 2.23
14 NaN NaN NaN NaN NaN NaN NaN NaN
15 1540.0 41.0 9.41 22.5 4.74 3.20 11.64 2.23
16 1580.0 32.0 9.27 22.8 4.82 2.70 12.20 2.50
17 NaN NaN NaN NaN NaN NaN NaN NaN
18 1550.0 30.0 9.00 20.0 4.50 2.50 10.00 2.00
2,3,4,5,6,7中的空值应填充Average(第1行,第8行)
9,10,11,12中的空值应填充平均值(第8行和第13行)
第14行的空值应填充平均值(第13行和第15行)
第17行的空值应填充Average(第16行和第18行)
我有一个5000行的数据框。我希望以这种方式填充空值。
发布于 2020-07-20 21:58:23
你可以尝试ffill
+ bfill
,然后取平均值
df = (df.ffill()+df.bfill())/2
https://stackoverflow.com/questions/62996868
复制相似问题