如何根据组中另一列的值来填充np.nan列？

根据组中另一列的值来填充np.nan列可以通过使用pandas库中的groupby和transform函数来实现。具体步骤如下：

导入必要的库：

import pandas as pd
import numpy as np

创建一个示例数据集：

data = {'Group': ['A', 'A', 'B', 'B', 'C', 'C'],
        'Value': [1, np.nan, 3, np.nan, 5, 6]}
df = pd.DataFrame(data)

使用groupby和transform函数根据组中的非空值计算每个组的平均值：

df['Mean'] = df.groupby('Group')['Value'].transform(lambda x: x.mean())

使用fillna函数将np.nan列填充为每个组的平均值：

df['Value'] = df['Value'].fillna(df['Mean'])

完成上述步骤后，np.nan列将根据组中另一列的值被填充为每个组的平均值。

这种方法的优势是可以根据组中的其他列的值进行填充，而不仅仅是根据组中另一列的值。适用场景包括数据清洗、数据预处理等。

推荐的腾讯云相关产品是腾讯云数据库TDSQL，它是一种高性能、高可用、可扩展的云数据库产品，适用于各种规模的应用场景。您可以通过以下链接了解更多关于腾讯云数据库TDSQL的信息：https://cloud.tencent.com/product/tdsql

基于另一列的pandas中类别的缺失值的补偿

、、

如何在pandas数据帧中填充NaN值？我的数据是这样的 id state zone xxx AP south xxx AP xxx AP xxx AP xxx delhi north xxx delhi xxx delhi xxx delhi xxx delhi 基于已知zone只属于state的AP列，如何在south列中填充缺失的值，如何使用pandas来填充值？

浏览 4提问于2020-01-21得票数 0

1回答

如何逐行应用numpy.where()或fillna()从新填充的行返回元素

、、、

我正在尝试根据以前的行和不同的列填充NaN行。我有以下代码： import pandas as pd import numpy as np data = {'value':[55,58,60,62,64,np.nan,np.nan], 'growth_rate': [np.nan,1.0545,1.034483,1.033333,1.032258,1.02,1.03]} df = pd.DataFrame(data) print(df) 它给出了以下数据帧： value growth_rate 0 55.0

浏览 0提问于2021-10-14得票数 1

1回答

为所有字符串列填充NaN，为所有数值列填充0

、

我有一个混合的数据帧，其中的列具有不同的类型： df A float64 B object C int64 如果我没有收到错误：TypeError: argument must be a string or number，如何运行fillna()？我的意思是，如何将所有数值类型都填充为0(作为Numer值)和所有对象类型都填充为NaN (作为字符串)的情况分开。这个类似的问题：Replace missing values at once in both categorical and numerical columns只回答了两列。我正在寻找一个有几个列的解决方案。

浏览 12提问于2020-08-24得票数 0

回答已采纳

1回答

缺失值(NaN值)与填充值的重叠图

、、、

我有下面的熊猫DataFrame，它包含两列。第一列是包含缺失值(NaN值)的原始值，第二列是为填充第一列中的NaN值而缺少的计算结果。如何在用填充值显示原始值的同一图中绘制这两列，如下图所示： Data=pd.DataFrame([[3.83092724, np.nan], [ np.nan, 3.94103207], [ np.nan, 3.86621724], [3.48386179, np.nan], [ np.nan, 3.7430167 ], [3.2382959 , np.

浏览 0提问于2020-06-24得票数 1

回答已采纳

2回答

根据来自另一列的值，在一行中的空列中填充多个值

、

我已经知道我将如何做到这一点-我只是好奇我的方法是否是最有效的。例如，让我们假设，不管出于什么原因，我有下表：表中的前4列都是重复的--它们只提供有关员工的信息。这些行重复的原因是该员工处理多个客户端。在某些情况下，我缺少关于雇员的年龄和员工持续时间的信息。另一位同事在excel表格中给了我这个信息。所以现在，我有关于Brian和Dennis的年龄和工作时间的信息，我需要根据这些信息填充所有行的员工I。我的计划是： data = {"14": # Brian's Employee ID {"Age":31, :"Employment

浏览 2提问于2020-02-16得票数 0

回答已采纳

3回答

熊猫数据栏中缺失值的有效解决方案？

、、

我需要在组内的dataframe列中转发填充值。我应该注意到，组中的第一个值从不会因构造而丢失。我现在有以下的解决方案。 df = pd.DataFrame({'a': [1,1,2,2,2], 'b': [1, np.nan, 2, np.nan, np.nan]}) # desired output a b 1 1 1 1 2 2 2 2 2 2 以下是我已经尝试过的三种解决方案。 # really slow solutions df['b'] = df.groupby('a')['b'

浏览 8提问于2017-03-28得票数 3

回答已采纳

5回答

根据一列中的值替换整个数据中的空值

、

我有这个数据： a b c d 1 NaN 1 2 NaN 1 3 4 3 NaN NaN 5 我需要根据column d的值替换每行中的空值。产出应是： a b c d 1 2 1 2 4 1 3 4 3 5 5 5 我试过这样的方法，但都没有用： df.fillna(df.d, inplace= True) df.iloc[:].fillna(df.d, inplace= True) df.replace(np.NaN, df.d, inplace=True) 我有太多的列，所

浏览 0提问于2019-08-27得票数 2

回答已采纳

2回答

用每列组的平均值填充NaN

、

我知道fillna()方法可以用来填充整个数据中的NaN。 df.fillna(df.mean()) # fill with mean of column. 如何将平均计算限制在NaN所在的组(和列)。实例： import pandas as pd import numpy as np df = pd.DataFrame({ 'a': pd.Series([1,1,1,2,2,2]), 'b': pd.Series([1,2,np.NaN,1,np.NaN,4]) }) print df 输入 a b 0 1 1 1

浏览 4提问于2015-11-30得票数 4

回答已采纳

1回答

熊猫:数字栏填充平均值，字符列填充模式。

、

我知道如何选择所有的数字列和平均填充to，但如何使数字列填充平均值和字符列填充模式？

浏览 1提问于2018-12-04得票数 1

回答已采纳

1回答

如何通过检查另一列来填充列的na值

、、

这张图片会更好地帮助：名为passengerId的专栏描述了组号和人号，同一个群体中的人通常是家庭，因此他们来自同一个星球。因此，它们是Home列中的nan行，我想通过了解PassengerID列中的组号来填充它。因此，我需要一个代码或一个循环，通过检查它们是否与某人在一个组中来填充homeplanet列中的na值(因为他们可能是一个家庭，因此他们在同一个地球上)。这基本上就是我需要的帮助，通过检查组号和使用Homeplanet组成员的Homeplanet作为na值的替换来填充Homeplanet列中的na值。我尝试过运行循环，但我甚至不知道要指定哪个参数。我将Passenge

浏览 1提问于2022-04-02得票数 0

回答已采纳

2回答

基于同一行中的值填充NaN单元格

、、、

我问了一个类似的问题，但没有得到答复，所以我想我会采取不同的方法，看看是否有人知道如何做到这一点；首先，我将告诉你我的目标和我已经知道的：我目前正在清理数据集，需要向后填充数据集，以消除一些NaN值。从下面的图片我想向后填充相同X列值的Na列，并用一行值为1的Y值填充Na单元格这张照片显示了我想要的结果我已经知道我可以用 df.loc[df['Y'] == 1] = df.loc[:,].bfill(limit=1) 若要使其只填充与Y值行1匹配的单元格(因此底Na单元格未填充)，请执行以下操作。下面是我的问题:使用上面的代码，它填充中间的N

浏览 3提问于2021-07-20得票数 2

回答已采纳

1回答

熊猫选择性使用填充剂()

、、、、

我想以一种选择性的方式在DataFrame中填充N/A值。特别是，如果列中有一系列相应的nan，我希望它们由前面的非nan值填充，但只有在nan序列的长度低于指定的阈值时才能填充。例如，如果阈值为3，则列内序列3或更少将填充前面的非nan值，而4个或4个以上的nan序列将按原样保留。也就是说，如果输入的DataFrame是 2 5 4 nan nan nan nan nan nan 5 nan nan 9 3 nan 7 9 1 我想要的输出是： 2 5 4 2 5 nan 2

浏览 3提问于2016-11-05得票数 1

回答已采纳

1回答

如何判断给定的2D数组在python中是否有空列

、

1问题我在练习。问题60询问如何判断给定的2D数组是否有空列？我想知道它是否要求检查一个满为0的列，还是用nan填充的一列？我找到了2种解决方案如果空列表示值都等于0的列，则此答案满足。 # Author: Warren Weckesser Z = np.random.randint(0,3,(3,10)) print((~Z.any(axis=0)).any()) 它使用了any()的一个技巧。注意到如果数组中的某个值不等于0，np.array().any()将返回True。例如： np.array([0,-1,0]).any() [Out]: True 但是，如果空列表示值都等于n

浏览 1提问于2019-04-30得票数 1

回答已采纳

1回答

对重复项进行分组，允许NaN等于任何值

、、、、

我想在基于多个列的DataFrame中聚合重复的行，但对“复制”的含义有一个非常规的定义。假设有一个包含两列的DataFrame：A和B In [45]: df = pd.DataFrame([[0, 0], [pd.NA, 0], [0, 1], [pd.NA, 1], [1, 1]], columns=['A', 'B']).convert_dtypes() In [63]: df Out[63]: A B 0 0 0 1 <NA> 0 2 0 1 3 <NA> 1 4 1

浏览 8提问于2020-03-21得票数 2

回答已采纳

1回答

函数无法解释NaN值

、、、、

我正在尝试摆脱数据帧中的NaN值。我希望根据列中值的分布来填充缺少的值，而不是用平均值填充NaN或做填充。换句话说，如果一列有120行，其中20行是NaN，80行包含1.0，20行包含0,0，我想用1填充80%的NaN值。为此，我创建了一个函数： def fill_cr_hist(x): if x is pd.np.nan: r = random.random() if r > 0.80: return 0.0 else: return 1.0 else: r

浏览 2提问于2018-12-18得票数 0

5回答

如何引用相对于for循环的另一列的列

、

df = pd.DataFrame([[np.nan,"cat","mouse", 'tiger'], ["tiger","dog","elephant", "mouse"], ["cat",np.nan,"giraffe", "cat"], [np.nan,np.nan,"ant", "ant"]], columns=["animal1","animal

浏览 2提问于2021-08-26得票数 0

回答已采纳

1回答

尝试用fill and ()和groupby()填充NaN

、、、

所以我基本上有一个包含几列的Airbnb数据集。其中几个参数对应于不同参数(清洁度、位置等)的额定值。对于这些列，我有一堆NaNs要填充。因为这些NaNs中的一些对应于来自同一所有者的列表，所以我想用这些列中每一列的相应主机评分平均值来填充一些NaNs。例如，假设对于主机X，review_scores_location的平均值是7。我要做的是，在review_scores_location列中，用7填充与主机X对应的所有NaN值。我已经尝试了以下代码： cols=['reviews_per_month','review_scores_rating',&#

浏览 6提问于2019-02-17得票数 0

回答已采纳

1回答

当NaN时，用前一次填充列值

、、、、

我有一个看起来像这样的pd.Series： >>> series 0 This is a foo bar something... 1 NaN 2 NaN 3 foo bar indeed something... 4 NaN 5 NaN 6 foo your bar self...

浏览 3提问于2017-11-01得票数 0

回答已采纳

2回答

Pandas填充其他行中的列中缺少的数据

、、

我有一个如下的df： df = pd.DataFrame({'id': ['a','b','c','d'], 'ac' : ['123','223', np.nan, np.nan], 'prev' : [np.nan, np.nan, 'a','b']}) 输出： id ac prev 0 a 123 NaN 1

浏览 13提问于2020-09-07得票数 1

回答已采纳

2回答

在Pandas Dataframes中用平均值正向填充NA

、、、、

我有以下数据，我想用最后一个可用值除以NaN的数量来填充前向的NaN+1单元： Update：我想迭代最后一个x列并进行操作，columns.values是一个元组(即它有多个行)。它应该类似于DataFrame.fillna(value=None, method=ffill)，但不应该使用最后一个可用值。最后的数据文件应该是这样的：谢谢你提前帮忙。

浏览 0提问于2018-10-26得票数 2

2回答

理解雪橇的KNNImputer

、、、、

我查看了它的文档，上面写着每个样本的缺失值都是使用训练集中发现的n_neighbors最近邻的平均值来估算的。如果两个都不缺少的特征接近，则两个样本是接近的。现在，在玩玩具数据集，即 >>>X = [[1, 2, nan], [3, 4, 3], [nan, 6, 5], [8, 8, 7]] >>>X [[ 1., 2., nan], [ 3., 4., 3.], [nan, 6., 5.], [ 8., 8., 7.]] 我们制作了一个KNNImputer如下： imputer = KNNImputer

浏览 2提问于2020-05-12得票数 5

回答已采纳

1回答

计算大熊猫数据的条件中值

、、、

我是Python/Pandas的新手。考虑以下代码： import pandas as pd import numpy as np df = pd.DataFrame({'Time': [0.0, 1.0, 2.0, 0.0, 1.0, 2.0, 0.0, 2.0, 0.0, 1.0, 2.0], 'Id': [1, 1, 1, 2, 2, 2, 3, 3, 4, 4, 4], 'A': [10, 15, np.NaN, 11, 16, 25, 10, 15, 9, 1

浏览 0提问于2018-05-14得票数 3

回答已采纳

2回答

根据频率使用列中的随机值填充DataFrame的DataFrame值

、、、

我试着用每一栏的随机数据来填写熊猫的数据，而这些随机数据出现在每一栏中，而每一栏都会显示出这种随机数据的频率。我有这个： def MissingRandom(dataframe): import random dataframe = dataframe.apply(lambda x: x.fillna( random.choices(x.value_counts().keys(), weights = list(x.value_counts()))[0])) r

浏览 0提问于2020-12-01得票数 3

2回答

将csv中的单列转换为分层列

、

当我导入一个csv文件时，该文件只包含一个由州和城市组成的列，例如： ALABAMA NaN Birmingham Montgomery Huntsville NaN CALIFORNIA NaN Los Angeles San Diego Fresno NaN 我的问题是，如何将其转换为两个分层列，使其看起来更像以下内容： ALABAMA Birmingham Montgomery Huntsville CALIFORNIA Los Angeles San Diego Fresno 我尝试创建一个e

浏览 0提问于2018-05-17得票数 0

2回答

如何在pandas中合并2个序列

、、

浏览 7提问于2018-08-12得票数 2

回答已采纳

2回答

如何在行中填写给定条件的列的平均值

、

当行值为0，行值为1时，如何分别用一列的平均值来填充缺失数据。我试过的是， sample = sample.fillna(sample.loc[sample['val'] == 1].mean()) 我想要做的是分别计算val为1和Val为2时的NaN。就像这样， sample = Fillna(sample.mean() If row is 1) & Fillna(sample.mean() If row is 0 )

浏览 5提问于2019-03-29得票数 1

回答已采纳

2回答

在多个列上使用pandas ()

、

我是一个新的pandas用户(截至昨天)，我发现它有时既方便又令人沮丧。我目前的挫败感是试图在数据帧的多个列上使用df.fillna()。例如，我有两个部分重叠的数据集(一个较新的集合和一个较旧的集合)。对于我们有新数据的情况，我只是使用它，但如果没有更新的数据，我也想使用旧的数据。似乎我应该能够使用fill to ()将较新的列填充到较旧的列中，但我在这方面遇到了麻烦。尝试一个具体的例子： df.ix[:,['newcolumn1','newcolumn2']].fillna(df.ix[:,['oldcolumn1','oldco

浏览 4提问于2013-08-02得票数 2

回答已采纳

1回答

如何在NaN DataFrame中按相邻列的平均值填充Pandas值

、、、、

我有一个很大的数据集，我有一些缺失值，我想通过前后列的平均值来填充NAN值，在某些情况下，我有连续的NaN值在这些情况下，我想用可以找到的第一个非nan值替换所有这些nan值，例如： 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 NaN NaN NaN NaN 29.0 30.0 NaN 16.0 15.0 16.0 17.0 NaN 28.0 30.0 NaN 28.0 18.0 目标是让数据看起来像这样： 0 1 2 3 4

浏览 0提问于2020-06-30得票数 0

2回答

如何根据熊猫中列的数据类型，用适当的值填充空值？

、

我在读csv in pandas。现在，我需要填充空值并将其转储到表中。所以我就是这么做的。 import pandas as pd from sqlalchemy import create_engine df = pd.read_csv(file_path) df.fillna('', inplace=True) engine = create_engine('postgresql://username:******@localhost:****/database') df.to_sql("my_table", engine) 现在的问题是

浏览 1提问于2020-03-24得票数 0

3回答

使用Pandas查找分组行的最小值

、、、

这可能是一个微不足道的问题，但我仍然在努力弄清楚pandas/numpy。因此，假设我有一个具有以下结构的表： group_id | col1 | col2 | col3 | "A" | "B" x | 1 | 2 | 3 | NaN | 1 x | 3 | 2 | 3 | 1 | 1 x | 4 | 2 | 3 | 2 | 1 y | 1 | 2 | 3 | NaN | 3

浏览 0提问于2017-01-04得票数 9

回答已采纳

3回答

在Pandas dataframe中水平填充单元格值

、、、、

我知道如何在同一列的行中填充值。但是，当您需要在dataframe中的某些多列中填充值时，如何做到这一点呢？下面是一个例子：初步发展基金： import pandas as pd inidf = [('Prod', ['P1', 'P2']), ('A', ['1', '1']), ('1', ['', '40']), ('2', ['10', '60']), ('3', [&

浏览 1提问于2017-08-13得票数 2

回答已采纳

2回答

替换除熊猫数据栏外的所有列中缺失的值

、

我有一个熊猫数据栏，有10列，我想填充除一列之外的所有列的缺失值(假设该列称为test)。目前，如果我这样做： df.fillna(df.median(), inplace=True) 它用中值替换所有列中的NA值，如何在不指定所有其他列的情况下排除特定列。

浏览 5提问于2017-03-21得票数 8

回答已采纳

2回答

如何在Pandas中应用NaN时忽略groupyby值

、

我有一个由多列组成的数据集，我想使用Python中的groupby函数来计算平均值。但是，由于其中一些值是NAN，因此当存在NAN值时，我得到该特定组的平均值为NAN。我想省略这个值，不是将它设置为零，也不是用任何统计变量填充它，只要省略即可。你知道我该如何做到这一点吗？提前感谢！

浏览 1提问于2017-04-05得票数 0

1回答

用包含2个其他列的条件填充pandas列中的值

、、

我试图以这样一种方式填充这个'C‘列:当'A’中的值不是NaN时，'C‘从'B’中获取值，否则'C‘中的值保持不变。代码如下： import pandas as pd import numpy as np df = pd.DataFrame({'A': ['greek', 'indian', np.nan, np.nan, 'australian'], 'B': np.random.random(5)}) df['C'] = np.nan

浏览 11提问于2021-08-06得票数 1

回答已采纳

1回答

Pandas:用一个群的模式填充na

、、、

我有一个包含多列的df。 df = pd.DataFrame({'Store':['M1','M2','M3','M1','M1','M2','M2','M3','M3'], 'Category':['A','A','A','B','B','B','C','C

浏览 3提问于2021-06-15得票数 4

1回答

按ID分组Pandas行，并在所有ID相同的行上显示时，向右填充保留NaN

、、、

我有一个熊猫DataFrame，我需要： ID列(而不是索引中)的组，仅当它不是NaN 时，才使用前面的值(多列)向右填充对于每个ID分类值和每个度量列(参见下面示例中的aX列)，只有值(当有多个行时是NaN - np.nan)。以这为例： In [1]: import numpy as np In [2]: import pandas as pd

浏览 1提问于2020-12-03得票数 0

回答已采纳

2回答

在pandas数据帧中对自定义值进行正向填充

、

我希望在一些数据框列上执行正向填充。ffill方法用以前填充的值替换缺少的值或NaN。在我的例子中，我想执行一个正向填充，不同的是我不想在Nan上这样做，而是针对一个特定的值(比如"*")。下面是一个例子 import pandas as pd import numpy as np d = [{"a":1, "b":10}, {"a":2, "b":"*"}, {"a":3, "b":"*"}, {"a&#

浏览 9提问于2020-06-25得票数 1

回答已采纳

2回答

用随机值填充空值

、

我正在尝试用随机数填充我的连续变量列中的空值。我尝试了下面的代码，但似乎不能用随机数填充空值。有什么想法吗？ df.mask(np.random.choice([True, False], size=df.shape, p=[.2,.8]))

浏览 1提问于2021-11-28得票数 0

2回答

如何使用scikit learn中缺失的XGBRegressor参数

、、

我正在处理一个在某些列中包含缺失值的数据集。我正在尝试使用XGBoost的Scikit-Learn包装器接口的XGBRegressor。在那里，它提供了一个名为'missing‘的参数，你可以在其中输入浮点值，否则它会将python的NaN作为默认值。因此，我需要一些帮助，比如如何使用此参数来填充数据集中列的缺失值。如果能给我提供一个简单的例子，那将是很有帮助的。

浏览 23提问于2017-02-09得票数 0

回答已采纳

1回答

基于列条件的前后向填充DataFrameGroup

、、

我正在根据ID对DataFrame上的一列进行回发和转发填充。尝试解决办法： def my_func(x): if merged['email_conf'].isnull().all(): return x.bfill().ffill() else: return merged['email_conf'].bfill().ffill() merged['email_unconf'] = merged.groupby('id')['email_unconf'].ap

浏览 10提问于2022-09-01得票数 -1

回答已采纳

3回答

如何在python中使用groupby语句填充in

、、、、

我正在尝试填充我的数据帧中缺少的值。但是，我想用groupby语句填充缺少的列。所以这是我的数据帧的样子... Number Other 1435 NaN 1435 NaN 1435 COOL 1817 NaN 1817 YES 所以我想要做的基本上就是取最大值或具有数据的最后一个值，并用该值填充该特定数字的na……例如，对于1435，我想要按数字对其进行分组，然后在该列中查找max()，这样它就会发现很酷，然后用酷填充另一列中的所有NaN。我的最终数据帧将如下所示 Number Other 1435 COOL

浏览 0提问于2017-11-11得票数 2

2回答

如何忽略pandas dataframe中的值，而不是删除它

、、、、

我通过连接几个数据集创建了一个数据集。其中一些有一个额外的列co2_rating。我希望保留它，因为它与目标变量具有线性关系，因此用0填充了另一个数据集的co2_rating列。但这会影响变量之间的关系。在进行数据分析或创建线性回归模型训练/测试时，如何忽略某个或多个值

浏览 4提问于2021-08-10得票数 0

2回答

Python Pandas Fillna中值不工作

、、、、

我正在尝试填充包含多列和多行的数据帧中的所有nans。我使用它来训练一个多变量ML模型，所以我想用中值填充每一列的nans。为了测试median函数，我这样做： training_df.loc[[0]] = np.nan # Sets first row to nan print(training_df.isnull().values.any()) # Prints true because we just inserted nans test = training_df.fillna(training_df.median()) # Fillna with median print(test.

浏览 0提问于2018-03-06得票数 8

回答已采纳

2回答

替换行中的最后一个非NaN值

、、、

我想用NaN值替换数据帧中最后的所有非NaN。我的数据框架中有300行和1068列。每一行都有不同数量的有效值，其中填充了NaNs。下面是一个行的示例：数据中的一行= [1 2 3 NaN NaN NaN] output = [1 2 NaN NaN NaN NaN] 如何替换CSV文件中行中的最后一个非NaN值？

浏览 2提问于2020-07-15得票数 0

回答已采纳

3回答

基于其他栏的if- of填充熊猫DataFrame的新列

、、、

有一种情况是，我希望在Pandas DataFrame中创建一个新列，并根据涉及另外两个列的条件填充它。在本例中： import pandas as pd import numpy as np df = pd.DataFrame(np.array([['value1','value2'],['value',np.NaN],[np.NaN,np.NaN]]), columns=['col1','col2']) 我想要创建一个新的列，“new”，它包括1) col2中的值(如果它不是NaN else )，2) col

浏览 0提问于2019-05-13得票数 3

回答已采纳

3回答

迭代Pandas中的行和列

我正在尝试为列中的所有NaNs值填充列的平均值。 import numpy as np import pandas as pd table = pd.DataFrame({'A':[1,2,np.nan], 'B':[3,np.nan, np.nan], 'C':[4,5,6]}) def impute_missing_values(table): for column in table: for value in column:

浏览 21提问于2019-01-01得票数 3

回答已采纳

1回答

根据NaN中NaN发生日期的时间，使用'ffill‘和’插值‘填充NaN

、、、、

我想使用‘NaN’和‘插值’来填充df中的NaN，这取决于NaN发生的时间。如下所示，第一个NaN发生在上午6时，第二个NaN发生在上午8时。 02/03/2016 05:00 8 02/03/2016 06:00 NaN 02/03/2016 07:00 1 02/03/2016 08:00 NaN 02/03/2016 09:00 3 我的df由上千天组成。我想对早上7点之前发生的任何NaN申请“ffill”，在早上7点以后使用“插值”。我的数据是从早上6点到下午6点。我的尝试是： df_imputed = (df.between_time("00:

浏览 0提问于2018-12-09得票数 1

回答已采纳

1回答

在计算knn中的“距离平均”时，用knn方法计算特定列中的NaN值

、、、、

当我从零开始执行Knn估算方法来处理丢失的数据时，我遇到了这个问题。我创建一个虚拟数据集，并为包含缺失值的行查找最近的邻居，这里是我的数据集。 A B C D E 0 NaN 2.0 4.0 10.0 100.0 1 NaN 3.0 9.0 12.0 NaN 2 5.0 2.0 20.0 50.0 75.0 3 3.0 5.0 7.0 NaN 150.0 4 2.0 9.0 7.0 30.0 90.0 对于行0，最近的邻居是1和2，为了代替

浏览 3提问于2021-08-24得票数 2

回答已采纳

1回答

用分组窗体中最常用的值填充缺少的值

、

? 谁能帮助我用最常见的值，但分组的形式填充缺失的值？.Here我想用相同型号的汽车填充气缸的缺失的值列。我试过这个： sh_cars['cylinders']=sh_cars['cylinders'].fillna(sh_cars.groupby('model')['cylinders'].agg(pd.Series.mode)) 还有其他的，但我每次都会收到错误信息。提前谢谢。

浏览 6提问于2021-01-29得票数 1

回答已采纳

2回答

如何根据以前的列填充NaN值

、、

我有一个初始列，没有丢失数据(A)，但有重复的值。如何用缺失的数据填充下一列(B)，使其被填充，并且左侧的列始终在右侧具有相同的值？我也希望其他列保持不变(C) 例如，这就是我所拥有的 A B C 1 1 20 4 2 2 NaN 8 3 3 NaN 2 4 2 30 9 5 3 40 1 6 1 NaN 3 这就是我想要的 A B C 1 1 20 4 2 2 30* 8 3 3 40* 2 4 2 30

浏览 14提问于2020-02-12得票数 1

回答已采纳