腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
用
线性
趋势
替换
数据
帧
缺失
值
我有一个导入的
数据
帧
,其中x2中缺少一些
值
。下面是一个简化的例子。 我想用上一个和下一个可用的
值
之间的
线性
趋势
来
替换
缺少的
值
。 对如何做有什么建议吗?
浏览 12
提问于2021-04-23
得票数 1
回答已采纳
1
回答
用
统计模型处理
缺失
值
局部
线性
趋势
模型
、
、
、
我正在使用statsmodel来拟合一个局部
线性
趋势
状态空间模型,该模型继承自sm.tsa.statespace.MLEModel类,使用文档中示例中的代码: https://www.statsmodels.org/dev/examples/notebooks/generated/statespace_local_linear_trend.html 状态空间模型和卡尔曼滤波器应该自然地处理缺少的
值
,但是当我添加一些空
值
时,状态空间模型会输出空
值<
浏览 22
提问于2021-09-03
得票数 0
回答已采纳
1
回答
将数值表达式从Y轴转换为X轴
我想转换一行数字,表示标准曲线上的Y轴这一行表示我想要得到的X轴(目标结果);-0,3979-0,2041这一行表示Y轴(起点);18,7019,88
浏览 0
提问于2019-04-12
得票数 1
回答已采纳
1
回答
随机森林与Logistic回归
我正在处理一个
数据
集。这是一个分类问题。
数据
集中的一列在总共300 k观测
值
中有大约11000个
缺失
值
(它是一个范畴变量,因此不可能像数值那样计算
缺失
值
)。在随机森林不受
缺失
值
影响的情况下,采用随机森林而不是Logistic回归是明智的吗? 另外,在使用RF时,我是否需要考虑自变量之间的多重共
线性
,还是不需要这样做?
浏览 2
提问于2019-04-14
得票数 0
回答已采纳
2
回答
Python pandas折线图:将x轴更改为
线性
、
、
、
、
我有一个熊猫
数据
框,它看起来像:我想做一个具有
线性
x轴的
线性
图,尽管x
值
不是
线性
的。目前,如果我将此
数据
帧
绘制为df.plot(),则会得到以下结果,因为x
值
不是
线性
的: 但是,上面的图表没有正确地显示
趋势
。我想要的是: 请注意,X轴记号和标签是
线性
的,但
值
不是
线性
的
浏览 9
提问于2018-02-09
得票数 1
回答已采纳
2
回答
读取netCDF文件时缺少
值
'--‘
、
、
、
在读取NetCDF文件时,我将我的水柱
数据
存储到
数据
帧
中,以便再次读取。在
数据
帧
中,我提出了
缺失
值
--,这些
值
也可能被称为“掩码”
值
。我尝试使用filedata.replace('--','nan')
替换
它们,但它甚至
替换
了浮点数,并且我得到了使用nan的整个
数据
帧
。此外,pd.dropna()也不起作用。在读取netcdf
浏览 4
提问于2018-08-28
得票数 1
2
回答
将missing
替换
为r中系数列的模式和数值列的均值
、
、
、
、
我将下面的
数据
帧
命名为“列车”。列bflag和zfactor是factor,其他2列是数字。我想在同一
数据
框中用mode
替换
factor列的
缺失
值
,
用
mean
替换
数值变量的
缺失
值
。
浏览 0
提问于2018-04-29
得票数 1
1
回答
是否有现成的模型可以处理条件相关性?
、
、
、
我一直在研究卡格尔房价
数据
集的特性(注意:这是一个非排名条目,所以这只是为了练习),我发现了几种情况,在这些情况下,该特性与房屋销售价格之间存在正相关,但前提是
数据
存在。在一种情况下(如下图所示),超过10%的
数据
集具有null (意思是“不适用”,而不是“
缺失
”,因此我无法
用
估算来填充它),但在非空
值
中,散点图显示了正相关性。我
用
0来实验和
替换
零
值
,当我再次查看散点图时,我发现新0年代的数值跨越了价格范围的很大一部分,并改变了<em
浏览 0
提问于2021-03-09
得票数 0
回答已采纳
1
回答
在NA中删除
数据
帧
中的离群
值
、
、
我有一个包含多个NAs的
数据
帧
。我需要找出离群
值
并用中值
替换
它们,但是如果有
缺失
值
,我现在的所有函数都不起作用。我
用
R,你知道吗? 提前感谢
浏览 0
提问于2016-10-19
得票数 0
1
回答
用
分类列中的随机
值
填充丢失的
数据
- Python
、
、
、
我在研究一个酒店预订
数据
集。在
数据
帧
中,有一个名为“agent”的离散数字列,它有13.7%的
缺失
值
。我的直觉是只删除
缺失
值
的行,但考虑到
缺失
值
的数量并不那么小,现在我想使用随机抽样计算,
用
现有的分类变量按比例
替换
它们。agent'].fillna(lambda x: random.choice(new_agent,inplace=True)) 前3行是nan,但现在在0x
浏览 2
提问于2021-03-03
得票数 1
回答已采纳
3
回答
有时丢失
数据
的机器学习
、
、
、
、
为了简单地理解:我有时拥有与5个路由器相关的设备的RSSI,有时只与3个路由器相关,在最坏的情况下,我的
数据
只有1,所以我的
数据
有时如下所示: room: 1, device_id: 1, rssi1:机器学习将是完美的,但如果
数据
总是在那里,而不是某些
值
缺失
的时候。当有时我拥有所有的
数据
,有时只有几个
数据
时,我应该为这种场景使用什么样的
数据
算法。
浏览 0
提问于2016-06-27
得票数 2
2
回答
Excel -使用
线性
趋势
计算
缺失
值
、
、
假设我有一本书,其中有A1:B9中的
数据
。有没有一种方法可以计算出介于两者之间的
值
,假设它们符合最佳拟合线?
值
将占用abcdefg。
浏览 2
提问于2014-07-29
得票数 0
1
回答
如何有效地外推多个变量的
缺失
数据
、
、
、
我有面板
数据
,在某些年份之前,许多变量都没有观察到。年份因变量而异。跨多列推断
缺失
数据
点的有效方法是什么?我正在考虑一些简单的东西,比如从
线性
趋势
进行外推,但我希望找到一种有效的方法来将预测应用于多个列。下面是一个样本
数据
集,与我正在处理的
数据
集的
缺失
情况类似。在本例中,我希望使用每列中观察到的
数据
点计算出的
线性
趋势
来填充“国家GDP”和“国家预期寿命”变量中的NA
值
。
浏览 1
提问于2013-03-25
得票数 3
回答已采纳
4
回答
R:根据列前缀和后缀有条件地
替换
值
、
、
、
我有两个
数据
帧
。
数据
框架A有许多观察/行、每个观察的ID和许多额外的列。对于观察X的子集,一组列的
值
缺少/NA。
数据
帧
B包含X(可以使用ID跨
数据
帧
进行匹配)和变量的子集,它们的名称与
数据
帧
A相同,但包含
用
缺失
/NA
替换
列中
缺失
值
的
值
。 下面的代码(使用联接操作)只是添加列,而不是
浏览 5
提问于2017-06-05
得票数 1
回答已采纳
2
回答
大熊猫滚动申请缺少
数据
、
、
、
我想对丢失的
数据
进行滚动计算。3 6 5 12 7 NaN 9 24 我认为在“滚动”过程中,缺少
数据
的窗口在计算时被忽略了
浏览 1
提问于2012-11-15
得票数 13
2
回答
无法将类""amelia"“强制为R中的data.frame
、
、
我在R中使用Amelia包来处理缺少的
值
。当我试图
用
估算的
数据
训练随机森林时,我得到了下面的错误。我不确定如何将amelia类转换为
数据
帧
,它将是R中randomForest函数的正确输入。
浏览 0
提问于2014-09-27
得票数 1
2
回答
识别并
替换
dataframe中值与
趋势
变化太大的元素
、
我正在尝试
替换
时间序列
数据
帧
中变化太多的
数据
点,该
数据
帧
呈下降
趋势
。假设我的
数据
如下所示:df = pd.DataFrame(data=d) 我如何检测从80到20的变化是否太大,并将其
替换
为适当的
值
,或者干脆完全删除行?我尝试过使用median_filter(df[
浏览 27
提问于2021-05-28
得票数 1
回答已采纳
3
回答
部分未知向量的最近邻
、
、
、
、
我猜因此,假设我们计算出170cm是身高的平均值,并将person C重新定义为[60kg, ~170cm, 50y]。(最好是在简单的经验算法中),我们应该以某种方式惩罚未知
值
的向量吗?
用
多少(可能计算出每两个人的身高之间的平均差值)?
浏览 4
提问于2017-09-23
得票数 1
1
回答
如何用前后平均日来填写
缺失
的
数据
天数
、
、
、
、
我从雅虎财务公司(YahooFinancials)那里得到了亚马逊股票(Amazon)的
数据
,但有些日子还没有
数据
。我想知道是否有一种方法,使用google collab,然后“创建”那些
缺失
的日子,并用相邻日子的平均值来填充它们。 我想使用
数据
最近的日子,在
缺失
天数之前和之后,为
缺失
的日子创建
数据
。我想弄清楚这些
数据
,这样我就能绘制出没有随机“失踪”的日子。我想用实际有
数据
的前后两天的平均值来填充“
缺失
的”天数。
浏览 0
提问于2019-07-11
得票数 0
回答已采纳
3
回答
用
mean - Spark
数据
帧
替换
缺失
的
值
、
、
、
、
我有一个Spark Dataframe,其中有一些
缺失
值
。我想通过
用
该列的平均值
替换
缺少的
值
来执行一个简单的补偿。我对Spark非常陌生,所以我一直在努力实现这个逻辑。df.select(mean("ColA")) .otherwise($"ColA")) b)然而,我还不能弄清楚,如何对我的
数据
帧
中的所有列执行此操作我曾经尝试过Map函数,但我相信它会遍
浏览 1
提问于2016-10-15
得票数 17
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
在 Python 中使用线性回归预测数据
使用Python进行数据清洗
python-pandas学习(三)Pandas缺失值处理
【视频】为什么要处理缺失数据?如何用R语言进行缺失值填充?
数据处理专题3:缺失值处理
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券