如何用每列的平均值来填充缺失值

文章/答案/技术大牛

发布

1回答

用数据集中按键分组的平均值填写NaN值(熊猫)

python、pandas

如何用NaN所在的特定列的平均值填充数据集中每个列的NaN值(在我的例子中是位置)？例如：我有一个名为PM2.5的列，在某些监视器的某些行中有一些缺失的值。这些监视器位于不同的位置(我将它们按有其位置的列组织起来)。我希望用监视器在每个特定元素/

浏览 7提问于2022-04-10得票数 0

3回答

python、pandas

y12N=y12N.fillna(y12N.mean()) 我已经尝试过这种方法，它不会在我的列中填充任何数据，因为表保持原样。NaN值是np.NaN值。

浏览 1提问于2018-08-29得票数 0

2回答

填充缺失的值并进行规范化

keras、pandas、normalization、missing-data、numpy

我有两列神经网络的训练数据，它们都是缺失的值。(还有许多其他列不缺少值。)例如180 | 70N/A | N/A我还被建议通过减去每

浏览 0提问于2018-07-26得票数 8

1回答

熊猫:每组按加权平均值填写缺失值

python、pandas、missing-data、weighted-average

我有一个dataFrame，其中‘value’列有缺失的值。我想在每个“名称”组中按加权平均值填充缺失的值。在每一组中都有关于如何用简单平均值来填充缺失值的帖子，而不是加权平均值。非常感谢!B 1.0 27 C NaN

浏览 3提问于2017-01-21得票数 2

回答已采纳

1回答

如何用多个时点填充数据集中缺少的值，但我只想为每个参与者传递最后的观察结果？

python、dataframe、missing-data

我有一个名为“BPMEDS”的列，其中有缺失的数据，其中很多是缺失的最后一个时间点(无论是1、2还是3)。BP药品的最后一个填充行位于每个空行的上方。因此，“randid”16799在第3期没有“bpmeds”，而在第2期有“bpmeds”，我只想复制上一个可用期间的值。每个参与者都有一个ID，因此该ID最多可以在数据集中显示3次。0.0 1 30 20375 0.0

浏览 6提问于2022-09-01得票数 0

1回答

探索性数据分析

machine-learning、data-mining、predictive-modeling、data-science-model、data-analysis

Dataset缺少值。什么是最好的方法来计算缺失的值。此外，目标特性中也缺少一些值。到目前为止，我已经从数据集中删除了这些观测结果。有多个相同ID的实例，其中一些变量不会改变，即年龄、体重、身高等，但是缺少一些值。我试图用相同ID的其他给定值来计算缺少的值。我如何用Python来解释它呢？提前谢谢。

浏览 0提问于2018-10-08得票数 0

1回答

在python中裁剪数据帧

python-3.x、pandas、dataframe

我希望在旧数据帧的基础上创建新的数据帧，这样只会有超过列平均值的值。我的问题是，当然，每一列都有不同的平均值，我不想单独计算它，然后用不同的值来剪裁每一列。我尝试了双循环，因为有不同的行数和列数，但没有成功。例如，我有以下数据帧：1 2

浏览 0提问于2018-02-09得票数 1

回答已采纳

1回答

用以前列值的平均值填充数据

python、pandas、dataframe

我有一个有5列且缺少值的dataframe。如何用前两列值的平均值来填充缺失的值。下面是相同的示例代码。0.3 0.3 0.2 0.8 NaN3 0.2 0.5 NaN NaN NaN这是我想要的结果应将每<

浏览 3提问于2022-06-10得票数 0

回答已采纳

0回答

用R中的列中位数填充数据框列中的缺失值

r、dataframe、missing-data

我有一个数据框，其中一些列的类型为"factor“，另一些列的类型为"numeric”。在任何"factor“列中都没有缺失值。我正在尝试使用以下代码将每列中的缺失值替换为列中位数： df3[is.na(df3[,i]), i] <- median(df3[,i], na.rm=

浏览 0提问于2017-12-12得票数 0

回答已采纳

2回答

尝试给出一个分组(按两个变量)的平均值，如果不可能的话，在python大熊猫中给出列平均值。

python、pandas、try-catch、pandas-groupby、average

我试图按2变量分组，并使用分组平均值来填充列中缺少的值。然后，如果这不起作用，我想通过1变量进行分组，并给出分组平均值来填充同一列的缺失值，如果不起作用，我希望给出整个列的平均值来填充缺失的值(不进行任何分组，因为这是我最

浏览 3提问于2020-11-06得票数 1

回答已采纳

1回答

处理数据集中丢失数据的最佳方法是什么？

dataset、data、data-cleaning、data-analysis、missing-data

我有一个数据集，其中包含某些列中缺少的值。我想知道处理这些缺失数据的最佳方法是什么。我应该删除丢失数据的行，还是用一些估计值(如平均值或中值)来填充缺失的值？这些方法对数据分析有什么影响？还有其他技术可以用来处理丢失的数据吗？他们主要是化学产品的运输数据，我给你们三个： https://ca

浏览 0提问于2023-04-29得票数 0

3回答

用SAS中列的平均值替换缺失的值

sas

我在SAS中有一个数据集，它有多个缺少数据的列。将整个数据集中的所有缺失值替换为零。但是，由于它遍历了整个数据集，所以不能仅仅用该列的平均值或中值来替换零。如何用该列的平均值替换丢失的数据？只有5个左右的列，因此脚本不需要遍历整个数据集。

浏览 7提问于2016-07-07得票数 1

回答已采纳

2回答

如何根据以前的列填充NaN值

python、pandas、dataframe

我有一个初始列，没有丢失数据(A)，但有重复的值。如何用缺失的数据填充下一列(B)，使其被填充，并且左侧的列始终在右侧具有相同的值？我也希望其他列保持不变(C) A B C2 2 NaN 84 230 9

浏览 14提问于2020-02-12得票数 1

回答已采纳

1回答

如何使用在训练数据集上创建的自定义输入程序来计算测试集中缺少的值

machine-learning、python、scikit-learn、preprocessing、data-imputation

我正在做一个玩具项目来预测索赔。其中一个输入特性具有空值，我已经在其上应用了自定义估算技术。在此技术下，我将丢失的值替换为目标特性的两个类别的平均值。fillna(dataframe.groupby('Target Feature')['Feature'].transform('mean')) 利用这种策略，设计了基于Logistic回归和支持向量分类器的分类模型现在，我不得不在测试集上运行我的</em

浏览 0提问于2021-01-18得票数 1

1回答

寻找根据R中其他值的比率来估算缺失值的函数(寻找基于概率的)

r、imputation

我有一个超过9000个数据点的数据框，有3列有近1000个(每列)缺失值。我不是在寻找最常用的方法(value=1000)，我找到了缺失的value=1000(每一列)，我尝试在那一列中根据它们的proportion.Suppose来分配其他行的值，其中一列的"a“

浏览 0提问于2019-08-05得票数 0

1回答

将BigQuery中的可空数据输入Tensorflow变换

python、tensorflow、google-bigquery、apache-beam、tensorflow-transform

我们正在尝试构建一个从BigQuery获取数据的管道，通过TensorFlow转换运行，然后再进行TensorFlow培训。 ))) schema_utils.schema_from_feature_spec(raw_d

浏览 1提问于2020-01-22得票数 6

回答已采纳

2回答

在Pandas中使用方法填充缺失值并按逻辑分组

python、pandas、grouping、missing-data

b 2 120因此，我的目标是填充列x3中所有缺失的值。但是，如果我使用标准方法(pd.fillna(df.mean()，就不会得到理想的结果。我想要的不是x3列的简单平均值()，而是对所有x1=a和x2=1值的x1=a()，如何用Python实现呢？

浏览 7提问于2017-01-13得票数 2

回答已采纳

1回答

滑雪教学中的归因问题

scikit-learn、data-cleaning

我使用了SimpleImputer()来填充缺失的值data_with_imputed_values = my_imputer.fit_transform(train_data) 我所期望的是，我的数据填充了缺失的单元格的该列的平均值。然而，它只适用于某一列，而不适用于

浏览 0提问于2023-01-26得票数 0

1回答

Python熊猫用另一个变量的模式填充一个变量的缺失值。

python、pandas、dataframe、missing-data

我希望用来自另一列的值的模式来填充一列缺少的值。first_name', 'last_name', 'age', 'sex', 'preTestScore', 'postTestScore'])我知道，我们可以用每个性别的postTestScore平均值填写缺失的p

浏览 0提问于2018-06-01得票数 0

回答已采纳

1回答

使用dplyr按组更改变量值

r、dplyr

我的问题是，我希望将多列的所有缺失值更改为每个组的平均值。(x,na.rm=TRUE)} 然而，这些代码并没有按物种来计算缺失，而是用每一列的所有不缺失值的平均值来</

浏览 3提问于2014-09-28得票数 4

回答已采纳

点击加载更多

用数据集中按键分组的平均值填写NaN值(熊猫)