腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
用数据集中按键分组
的
平均值
填写NaN
值
(熊猫)
python
、
pandas
如
何用
NaN所在
的
特定
列
的
平均值
填充
数据集中每个
列
的
NaN
值
(在我
的
例子中是位置)? 例如:我有一个名为PM2.5
的
列
,在某些监视器
的
某些行中有一些
缺失
的
值
。这些监视器位于不同
的
位置(我将它们按有其位置
的
列
组织起来)。我希望用监视器在每个特定元素/
浏览 7
提问于2022-04-10
得票数 0
3
回答
如
何用
每
列
的
平均值
来
填充
缺失
值
python
、
pandas
y12N=y12N.fillna(y12N.mean()) 我已经尝试过这种方法,它不会在我
的
列
中
填充
任何数据,因为表保持原样。NaN
值
是np.NaN
值
。
浏览 1
提问于2018-08-29
得票数 0
2
回答
填充
缺失
的
值
并进行规范化
keras
、
pandas
、
normalization
、
missing-data
、
numpy
我有两
列
神经网络
的
训练数据,它们都是
缺失
的
值
。(还有许多其他
列
不缺少
值
。)例如180 | 70N/A | N/A我还被建议通过减去
每
浏览 0
提问于2018-07-26
得票数 8
1
回答
熊猫:每组按加权
平均值
填写
缺失
值
python
、
pandas
、
missing-data
、
weighted-average
我有一个dataFrame,其中‘value’列有
缺失
的
值
。我想在每个“名称”组中按加权
平均值
填充
缺失
的
值
。在
每
一组中都有关于如
何用
简单
平均值
来
填充
缺失
值
的
帖子,而不是加权
平均值
。非常感谢!B 1.0 27 C NaN
浏览 3
提问于2017-01-21
得票数 2
回答已采纳
1
回答
如
何用
多个时点
填充
数据集中缺少
的
值
,但我只想为每个参与者传递最后
的
观察结果?
python
、
dataframe
、
missing-data
我有一个名为“BPMEDS”
的
列
,其中有
缺失
的
数据,其中很多是
缺失
的
最后一个时间点(无论是1、2还是3)。BP药品
的
最后一个
填充
行位于每个空行
的
上方。因此,“randid”16799在第3期没有“bpmeds”,而在第2期有“bpmeds”,我只想复制上一个可用期间
的
值
。每个参与者都有一个ID,因此该ID最多可以在数据集中显示3次。0.0 1 30 20375 0.0
浏览 6
提问于2022-09-01
得票数 0
1
回答
探索性数据分析
machine-learning
、
data-mining
、
predictive-modeling
、
data-science-model
、
data-analysis
Dataset缺少
值
。什么是最好
的
方法
来
计算
缺失
的
值
。此外,目标特性中也缺少一些
值
。到目前为止,我已经从数据集中删除了这些观测结果。有多个相同ID
的
实例,其中一些变量不会改变,即年龄、体重、身高等,但是缺少一些
值
。我试图用相同ID
的
其他给定
值
来
计算缺少
的
值
。我如
何用
Python
来
解释它呢?提前谢谢。
浏览 0
提问于2018-10-08
得票数 0
1
回答
在python中裁剪数据帧
python-3.x
、
pandas
、
dataframe
我希望在旧数据帧
的
基础上创建新
的
数据帧,这样只会有超过
列
平均值
的
值
。我
的
问题是,当然,
每
一
列
都有不同
的
平均值
,我不想单独计算它,然后用不同
的
值
来
剪裁
每
一
列
。我尝试了双循环,因为有不同
的
行数和
列
数,但没有成功。例如,我有以下数据帧:1 2
浏览 0
提问于2018-02-09
得票数 1
回答已采纳
1
回答
用以前列
值
的
平均值
填充
数据
python
、
pandas
、
dataframe
我有一个有5
列
且缺少
值
的
dataframe。如
何用
前两
列
值
的
平均值
来
填充
缺失
的
值
。下面是相同
的
示例代码。0.3 0.3 0.2 0.8 NaN3 0.2 0.5 NaN NaN NaN这是我想要
的
结果应将
每
<
浏览 3
提问于2022-06-10
得票数 0
回答已采纳
0
回答
用R中
的
列
中位数
填充
数据框
列
中
的
缺失
值
r
、
dataframe
、
missing-data
我有一个数据框,其中一些
列
的
类型为"factor“,另一些
列
的
类型为"numeric”。在任何"factor“
列
中都没有
缺失
值
。我正在尝试使用以下代码将
每
列
中
的
缺失
值
替换为
列
中位数: df3[is.na(df3[,i]), i] <- median(df3[,i], na.rm=
浏览 0
提问于2017-12-12
得票数 0
回答已采纳
2
回答
尝试给出一个分组(按两个变量)
的
平均值
,如果不可能的话,在python大熊猫中给出列
平均值
。
python
、
pandas
、
try-catch
、
pandas-groupby
、
average
我试图按2变量分组,并使用分组
平均值
来
填充
列
中缺少
的
值
。然后,如果这不起作用,我想通过1变量进行分组,并给出分组
平均值
来
填充
同一
列
的
缺失
值
,如果不起作用,我希望给出整个
列
的
平均值
来
填充
缺失
的
值
(不进行任何分组,因为这是我最
浏览 3
提问于2020-11-06
得票数 1
回答已采纳
1
回答
处理数据集中丢失数据
的
最佳方法是什么?
dataset
、
data
、
data-cleaning
、
data-analysis
、
missing-data
我有一个数据集,其中包含某些
列
中缺少
的
值
。我想知道处理这些
缺失
数据
的
最佳方法是什么。我应该删除丢失数据
的
行,还是用一些估计
值
(
如
平均值
或中值)
来
填充
缺失
的
值
?这些方法对数据分析有什么影响?还有其他技术可以用来处理丢失
的
数据吗?他们主要是化学产品
的
运输数据,我给你们三个: https://ca
浏览 0
提问于2023-04-29
得票数 0
3
回答
用SAS中
列
的
平均值
替换
缺失
的
值
sas
我在SAS中有一个数据集,它有多个缺少数据
的
列
。将整个数据集中
的
所有
缺失
值
替换为零。但是,由于它遍历了整个数据集,所以不能仅仅用该
列
的
平均值
或中值
来
替换零。如
何用
该
列
的
平均值
替换丢失
的
数据?只有5个左右
的
列
,因此脚本不需要遍历整个数据集。
浏览 7
提问于2016-07-07
得票数 1
回答已采纳
2
回答
如何根据以前
的
列
填充
NaN
值
python
、
pandas
、
dataframe
我有一个初始
列
,没有丢失数据(A),但有重复
的
值
。如
何用
缺失
的
数据
填充
下一
列
(B),使其被
填充
,并且左侧
的
列
始终在右侧具有相同
的
值
?我也希望其他
列
保持不变(C) A B C2 2 NaN 84 230 9
浏览 14
提问于2020-02-12
得票数 1
回答已采纳
1
回答
如何使用在训练数据集上创建
的
自定义输入程序
来
计算测试集中缺少
的
值
machine-learning
、
python
、
scikit-learn
、
preprocessing
、
data-imputation
我正在做一个玩具项目
来
预测索赔。其中一个输入特性具有空
值
,我已经在其上应用了自定义估算技术。在此技术下,我将丢失
的
值
替换为目标特性
的
两个类别的
平均值
。fillna(dataframe.groupby('Target Feature')['Feature'].transform('mean')) 利用这种策略,设计了基于Logistic回归和支持向量分类器
的
分类模型现在,我不得不在测试集上运行我
的</em
浏览 0
提问于2021-01-18
得票数 1
1
回答
寻找根据R中其他
值
的
比率
来
估算
缺失
值
的
函数(寻找基于概率
的
)
r
、
imputation
我有一个超过9000个数据点
的
数据框,有3
列
有近1000个(
每
列
)
缺失
值
。我不是在寻找最常用
的
方法(value=1000),我找到了
缺失
的
value=1000(
每
一
列
),我尝试在那一
列
中根据它们
的
proportion.Suppose
来
分配其他行
的
值
,其中一
列
的
"a“
浏览 0
提问于2019-08-05
得票数 0
1
回答
将BigQuery中
的
可空数据输入Tensorflow变换
python
、
tensorflow
、
google-bigquery
、
apache-beam
、
tensorflow-transform
我们正在尝试构建一个从BigQuery获取数据
的
管道,通过TensorFlow转换运行,然后再进行TensorFlow培训。 ))) schema_utils.schema_from_feature_spec(raw_d
浏览 1
提问于2020-01-22
得票数 6
回答已采纳
2
回答
在Pandas中使用方法
填充
缺失
值
并按逻辑分组
python
、
pandas
、
grouping
、
missing-data
b 2 120因此,我
的
目标是
填充
列
x3中所有
缺失
的
值
。但是,如果我使用标准方法(pd.fillna(df.mean(),就不会得到理想
的
结果。我想要
的
不是x3
列
的
简单
平均值
(),而是对所有x1=a和x2=1
值
的
x1=a(),如
何用
Python实现呢?
浏览 7
提问于2017-01-13
得票数 2
回答已采纳
1
回答
滑雪教学中
的
归因问题
scikit-learn
、
data-cleaning
我使用了SimpleImputer()
来
填充
缺失
的
值
data_with_imputed_values = my_imputer.fit_transform(train_data) 我所期望
的
是,我
的
数据
填充
了
缺失
的
单元格
的
该
列
的
平均值
。然而,它只适用于某一
列
,而不适用于
浏览 0
提问于2023-01-26
得票数 0
1
回答
Python熊猫用另一个变量
的
模式
填充
一个变量
的
缺失
值
。
python
、
pandas
、
dataframe
、
missing-data
我希望用来自另一
列
的
值
的
模式
来
填充
一
列
缺少
的
值
。first_name', 'last_name', 'age', 'sex', 'preTestScore', 'postTestScore'])我知道,我们可以用每个性别的postTestScore
平均值
填写
缺失
的
p
浏览 0
提问于2018-06-01
得票数 0
回答已采纳
1
回答
使用dplyr按组更改变量值
r
、
dplyr
我
的
问题是,我希望将多
列
的
所有
缺失
值更改为每个组
的
平均值
。(x,na.rm=TRUE)} 然而,这些代码并没有按物种
来
计算
缺失
,而是用
每
一
列
的
所有不
缺失
值
的
平均值
来</
浏览 3
提问于2014-09-28
得票数 4
回答已采纳
点击加载更多
相关
资讯
【视频】为什么要处理缺失数据?如何用R语言进行缺失值填充?
第三章 数据规整化
用pandas处理Excel
解决爬虫作业中遇到的NaN值问题
Scikit-Learn大变化:合并Pandas
热门
标签
更多标签
云服务器
ICP备案
即时通信 IM
云直播
实时音视频
活动推荐
运营活动
广告
关闭
领券