腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
用
均值
填充
pyspark
中所有列
的
缺失
值
python
、
apache-spark
、
pyspark
我正在尝试使用mean来
填充
我
的
pyspark
3.0.1数据帧
中
的
缺失
值
。我正在寻找像fillna函数这样
的
熊猫。例如 df=df.fillna(df.mean()) 但到目前为止,我发现在
pyspark
中
,正在使用单个列
的
均值
来
填充
缺失
值
,而不是整个数据集。你能建议我如何在
pyspark
中
浏览 31
提问于2021-03-08
得票数 1
回答已采纳
1
回答
用
均值
填充
pyspark
中
的
缺失
值
python
、
pyspark
、
mean
、
fillna
我正在尝试用
均值
填充
NaN
的
值
。下面是我正在使用
的
代码,下面是发生
的
错误- from
pyspark
.sql.functions import avg def fill_with_mean(df_1, exclude=set())有没有其他方法可以
用
mean来
填充
缺失
值
? 这是我
的
数据帧
的
样子: ? 我希望看到平
均值
填充
浏览 95
提问于2021-11-13
得票数 4
回答已采纳
1
回答
PySpark
用
分组
均值
填充
缺失
/错误
值
pyspark
、
apache-spark-sql
、
databricks
我有一个星火数据,有一个丢失和一个错误
的
价值。from
pyspark
.sql import Row| Pear| 05| 2.0||Mango| 07|-4.0|+-----+---+----+ 按整列进行
填充
是很简单
的
但我怎样才能做到分组
的
意
浏览 1
提问于2019-01-19
得票数 1
回答已采纳
1
回答
缺少
值
的
平
均值
python
、
scipy
、
statistics
、
missing-data
、
geometric-mean
我不知道如何处理有一些
值
缺失
的
二维数组股票回报。有什么建议吗?如何根据没有遗漏
的</
浏览 5
提问于2017-11-03
得票数 0
回答已采纳
1
回答
探索性数据分析
machine-learning
、
data-mining
、
predictive-modeling
、
data-science-model
、
data-analysis
Dataset缺少
值
。什么是最好
的
方法来计算
缺失
的
值
。此外,目标特性
中
也缺少一些
值
。到目前为止,我已经从数据集中删除了这些观测结果。有多个相同ID
的
实例,其中一些变量不会改变,即年龄、体重、身高等,但是缺少一些
值
。我试图
用
相同ID
的
其他给定
值
来计算缺少
的
值
。我如何用Python来解释它呢?提前谢谢。
浏览 0
提问于2018-10-08
得票数 0
1
回答
使用月平
均值
的
Pandas
填充
丢失小时时间点数据
的
方法
python
、
pandas
、
dataframe
我已经创建了每小时空气污染测量
的
数据框架。有一些
缺失
值
,我想用月平
均值
来替换。 我如何在我
的
原始数据框上使用fillna方法,
用
各自月份
的
平
均值
填充
缺失
的
数据?
浏览 1
提问于2016-12-16
得票数 2
1
回答
如何用多个时点
填充
数据集中缺少
的
值
,但我只想为每个参与者传递最后
的
观察结果?
python
、
dataframe
、
missing-data
我有一个名为“BPMEDS”
的
列,其中有
缺失
的
数据,其中很多是
缺失
的
最后一个时间点(无论是1、2还是3)。BP药品
的
最后一个
填充
行位于每个空行
的
上方。因此,“randid”16799在第3期没有“bpmeds”,而在第2期有“bpmeds”,我只想复制上一个可用期间
的
值
。每个参与者都有一个ID,因此该ID最多可以在数据集中显示3次。0.0 131
浏览 6
提问于2022-09-01
得票数 0
1
回答
平均模式计算与
填充
与
填充
计算
的
差异
pandas
、
dataframe
、
weka
、
missing-data
、
categorical-data
我
的
数据集有5%
的
丢失
值
。它是一个分类数据集,只有两个属性是数字
的
。如果
用
均值
和模式法计算
缺失
值
,则精度为0.781,回忆0.500和AUROC 0.756;若
用
填充
和
填充
法计算
缺失
值
,则精度为0。我不明白为什么我
的
补料效果很好?这意味着什么? 对于类别
缺失
值
输入,还有什么方法可用?
浏览 2
提问于2022-06-28
得票数 -1
1
回答
多元探索性分析:
用
聚类
均值
填充
缺失
值
python
、
pandas
、
k-means
我不想用0或变量平
均值
来
填充
缺失
的
值
,而是
用
数据集上其他类似观察
的
平
均值
来
填充
它们。A 8.7 4.3 5C 0.1 2.5 3所以在变量V2和V3上进行K-
均值
聚类。因为第二个集群与B相同,所以我希望
用
V1
的
第二个集群平
浏览 6
提问于2022-04-21
得票数 0
回答已采纳
2
回答
在python
中
处理数据集中
的
缺失
值
python
、
pandas
、
data-cleaning
如何选择是丢弃NaN
值
,还是
用
数据集中
的
平
均值
(或中位数)
填充
它?还有什么其他技术可以清除数据集中
的
缺失
值
?让数据为数字。(在python
中
)
浏览 0
提问于2018-05-29
得票数 2
2
回答
scikit-learn:通过随机采样来
填充
缺失
值
python
、
machine-learning
、
scikit-learn
、
data-science
令我惊讶
的
是,没有提供以下策略来
填充
缺失
值
:对于任何
缺失
值
,从给定
值
中
均匀随机采样一个
值
并进行替换。 我假设这是一种比
用
均值
、最频繁或中值替换更好
的
策略,因为它不会在
值
分布中产生人为
的
尖峰。在更多元级别的讨论
中
,当我在scikit-learn这样
的
库
中
找不到我认为是直接
的
、几
浏览 36
提问于2017-03-17
得票数 3
1
回答
如何删除包含75%
缺失
值
的
行,以及使用何种归责技术?
r
、
na
、
missing-data
我有一个dataframe 17631x15,并且希望找到一种简单
的
方法来删除包含75%
缺失
值
的
行。我不知道如何在一个函数
中
填充
阈值:我
的
数据显示出强烈
的
日变化和季节变化,我想知道
缺失
的
值
是否可以
用
几何平
均值
代替?
浏览 0
提问于2020-02-04
得票数 0
回答已采纳
2
回答
填充
缺失
的
值
并进行规范化
keras
、
pandas
、
normalization
、
missing-data
、
numpy
我有两列神经网络
的
训练数据,它们都是
缺失
的
值
。(还有许多其他列不缺少
值
。)例如180 | 70N/A | N/A通常,
浏览 0
提问于2018-07-26
得票数 8
1
回答
用
数据集中按键分组
的
平
均值
填写NaN
值
(熊猫)
python
、
pandas
如何用NaN所在
的
特定列
的
平
均值
填充
数据集中每个列
的
NaN
值
(在我
的
例子
中
是位置)? 例如:我有一个名为PM2.5
的
列,在某些监视器
的
某些行中有一些
缺失
的
值
。这些监视器位于不同
的
位置(我将它们按有其位置
的
列组织起来)。我希望
用
监视器在每个特定元素/列(本例
中
为PM2.5)
的<
浏览 7
提问于2022-04-10
得票数 0
1
回答
用
从先前替换
的
值
计算
的
特征平
均值
替换
缺失
的
值
data-cleaning
、
missing-data
我不知道该怎么问,但我会尽力
的
。 我已经
用
特性
的
平
均值
替换了一些
缺失
的
值
,条件是第二个分类特性。但是,并不是所有
缺失
的
值
都被替换,因为第二个特性
的
某些类别在第一个特性
中
没有任何
值
,因此无法计算它
的
平
均值
。然后,我再次尝试将剩馀
的
缺失
值
替换为第三个特性
的
平<e
浏览 0
提问于2020-01-09
得票数 1
1
回答
在照片中替换丢失
的
视图计数
pandas
、
data-cleaning
、
preprocessing
我目前正在分析Facebook上
的
一组帖子。有的是视频,有的是照片。其中一个特性是view_count,它在每次发布照片时都会丢失
值
。我怎样才能替换那些
缺失
的
值
?我能放0次吗?
浏览 0
提问于2022-02-22
得票数 0
1
回答
模型预测返回警告
python
、
pandas
、
machine-learning
我正在尝试建立一个模型来预测运动员获得奖牌
的
概率。我有一个数据帧,看起来像这样: ? 下面是我已经做过
的
事情 #Cleaning df 0 24.0 1 180 802 24.0 1 17527.0
浏览 51
提问于2021-09-24
得票数 0
3
回答
如何实现KNN对滑雪板管道
中
的
分类特征进行归属化
scikit-learn
我想使用KNN在一个滑雪管道
中
的
分类特征(多个分类功能
缺失
)。 是否有任何现有的方法允许使用KNN (或任何其他回归体)将
缺失
的
值
(在本例
中
是绝对
的
)归责于sklearn管道
浏览 1
提问于2019-09-03
得票数 1
回答已采纳
1
回答
列表示有限范围内
的
行
r
、
statistics
、
mean
我正在尝试用means替换NA,但在我
的
df中有37个不同
的
站点。我想要DF$STATION.NAME (在第1列
中
)是唯一
的
列
的
平
均值
。我不能用一个地方
的
数据去找另一个地方
的
平
均值
……很明显。所以我真的应该有每个月
的
平
均值
,每个站点
的
平
均值
。 我
的
数据是由station.name在第1列
中
垂直组织
的
,1-12
浏览 1
提问于2012-09-18
得票数 1
1
回答
将BigQuery
中
的
可空数据输入Tensorflow变换
python
、
tensorflow
、
google-bigquery
、
apache-beam
、
tensorflow-transform
我们正在尝试构建一个从BigQuery获取数据
的
管道,通过TensorFlow转换运行,然后再进行TensorFlow培训。SparseTensorValue(indices=[(0, 0), (0, 1)], values=['U', 'K'],
浏览 1
提问于2020-01-22
得票数 6
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用MICE进行缺失值的填充处理
大数据中填充缺失值很有效的树模型算法,MissForest算法
问卷数据中的缺失值插补方法
Excel中定位空值填充的具体操作步骤
Python数据分析之pandas(三)
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券