腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
对于
这个
数据
集
,如
何用
R
中
的
回归方程
中
的
模拟
值
来
估算
变量
的
缺失
值
?
、
、
、
我有以下大型
数据
集
的
示例。通过heckman选择模型,我通过以下代码估计了此
数据
的
回归模型 现在,我想用估计方程
来
估算
可变工资
的
缺失
值
。我创建了以下代码
来
模拟
回归方程
式
中
的
值
。但现在我
的
想法是,如
何用
薪水中
缺失
的
值
浏览 11
提问于2020-10-16
得票数 0
回答已采纳
1
回答
如何在线性模型
中
利用它自己
的
估计模型
来
估计丢失
的
DV?
、
这个
问题更多
的
是关于统计,而不是
R
编程,不过,由于我是
R
的
初学者,我特别想知道关于
R
的
任何想法;谢谢您
的
考虑: 我们
的
线性模型(lm)
中
的
结果
变量
是腰围,大约20%
的
数据
集中缺少腰围。去年发表了一个模型,可靠地从BMI、年龄和性别(所有这些我们都有)
来
估算
腰围。我想用
这个
模型
来</em
浏览 2
提问于2013-10-03
得票数 0
回答已采纳
3
回答
用什么预测模型
来
推断性别?
、
、
我
的
数据
如下:birth_date缺少634,990个
值
由于我有900 k项,这两项都是相当大
的
数量,所以我不能丢弃空行。
对于
birth_date,有人建议使用链式方程(小鼠)
的
多
变量
计算。我不知道我应该为gender使用什么预测模型。在未缺少
的
数据
中
,男性比女性多5倍。 谁能告诉我这里最好
的
做法是什么?填充gender
缺失</
浏览 0
提问于2019-05-07
得票数 5
回答已采纳
1
回答
如何在
R
中使用missForest包来处理测试
数据
?
我们基本上可以使用missForest包
来
输入
R
中
的
缺失
值
(
对于
分类和数字).But,这种方法需要一个完整
的
响应
变量
来
训练森林。那么,如何使用
这个
missForest包
估算
测试
数据
集中
的
缺失
值
,因为我们在测试
数据
集中没有任何response
变量
?
浏览 0
提问于2015-11-18
得票数 1
2
回答
预测
缺失
数据
的
方法
、
、
我有以下问题:我正在寻找方法
来
预测给定
数据
集中随机丢失
的
数据
。我读过关于PCA-方法
的
文章,但我想了解一下方法
的
优缺点,以及最近
的
研究概况(给定
数据</
浏览 0
提问于2016-10-23
得票数 2
2
回答
什么时候在
数据
分析问题中使用
缺失
数据
归属法?
、
、
、
根据研究问题,对
数据
集
进行统计分析,利用
R
建立logistic回归模型和多项式线性模型。但是,我想知道应该使用
缺失
值
估算
来完成
数据
集
的
步骤。我已经完成了对原始
数据
集中每个
变量
的
单
变量
分析,发现有三个连续
变量
和两个类别
变量
,有大量
的
缺失
数据
。在对每一个
变量
进行
浏览 0
提问于2019-08-11
得票数 6
3
回答
部分未知向量
的
最近邻
、
、
、
、
特征向量有3项[weight, height, age],在我们
的
列表中有3人。注意,,我们不知道人
的
身高C,。, 50y]我猜现在
的
问题是,我们把C和猜测
的
~170cm放在一起,而把B放在已知
的
169cm上。 感觉有点不对劲。我们人类比机器聪明,并且知道C完全是170cm
的
可能性很小。,但是我们如何计算
这个</e
浏览 4
提问于2017-09-23
得票数 1
1
回答
如何使用在训练
数据
集
上创建
的
自定义输入程序
来
计算测试集中缺少
的
值
、
、
、
、
我正在做一个玩具项目
来
预测索赔。其中一个输入特性具有空
值
,我已经在其上应用了自定义
估算
技术。在此技术下,我将丢失
的
值
替换为目标特性
的
两个类别的平均值。fillna(dataframe.groupby('Target Feature')['Feature'].transform('mean')) 利用这种策略,设计了基于Logistic回归和支持向量分类器
的
分类模型现在,我不得不在测试
集
上运行我
浏览 0
提问于2021-01-18
得票数 1
2
回答
将PCA应用于
R
中
具有NA
值
的
数据
我想将主成分分析(pcomp())应用于具有NA
值
的
数据
帧。我知道应用PCA is na
值
是不可能
的
,(我仍然尝试了)我得到了错误:Error in na.fail.default(X) : missing values in object。我不想删除任何行,因为它是一个相对较小
的
样本大小。那么我该怎么做呢?
浏览 1
提问于2020-05-11
得票数 0
1
回答
距离矩阵
中
缺失
数据
的
估计
、
我想问一下,是否有人熟悉距离矩阵
中
缺失
值
的
估算
。
对于
普通
数据
(具有连续
变量
和标称
变量
的
表),有大量
的
计算技术,
如
热甲板和冷面、预测模型等。然而,几乎没有关于如何处理距离矩阵
的
信息。示例:distance[c(10, 20, 30, 40, 50, 60)] <- NA 在这种情况下,如何计算<e
浏览 3
提问于2015-12-01
得票数 3
回答已采纳
1
回答
除了其他自
变量
外,还使用因
变量
计算其中一个自
变量
的
缺失
值
?
、
、
、
我想把一个自
变量
的
缺失
值
假设为
变量
X1,其他自
变量
与X1
的
相关性很弱。然而,因
变量
与X1有很强
的
相关性。我希望使用
的
缺失
值
估算
器,
如
KNN回归或ExtraTreesRegressor (类似于
R
中
的
错误林)。 除了自
变量
外,我还可以使用因
变量
来</
浏览 0
提问于2019-08-19
得票数 0
回答已采纳
2
回答
如何寻找分类
数据
与连续
数据
之间
的
相关性
、
、
、
我正在计算泰坦尼克号
数据
集中
的
空
值
。'Embarked'列有一些。我不想仅仅将它们全部设置为最常见
的
值
,'S'。我想根据'Embarked'与其他列
的
相关性
来
推断它。我尝试将
这个
公式应用于'Embarked'列: if e == 'S': return 1 if e == 'Q
浏览 0
提问于2020-07-14
得票数 1
回答已采纳
1
回答
对New/Predictor
数据
的
多重推算
、
有没有人能帮我理解一下如何处理新
的
/看不见
的
数据
中
的
缺失
值
?我已经研究了
R
中
的
几个多个补偿软件包,所有这些软件包似乎都只是(同时)对训练和测试
集
进行了
估算
。那么,您如何处理新
的
未标记
数据
,以便以与训练/测试相同
的
方式进行估计?基本上,我希望对训练/测试集中
的
缺失
<
浏览 3
提问于2014-10-06
得票数 3
2
回答
如何处理lmer列
中
的
缺失
值
(NA)
、
、
、
在某些列
中
对
数据
集
的
一些观察
中
存在NA
值
。我只想控制
这个
包含NA
的
变量
。在控制固定效果之后,
数据
集
的
大小是相同
的
。我认为我必须在lmer()中使用na.action。arg 1) 我
的
数据
:如下所示,在所有的控制
变量
中都有相当多
的
NA。因此,“扔掉”所有这些观察是没有选择
的
浏览 8
提问于2022-10-21
得票数 1
回答已采纳
3
回答
当
数据
丢失60%时,您如何处理丢失
的
数据
?
、
我
的
数据
有很多
缺失
值
,我必须预测这些
值
。一种方法是取这些
值
的
平均值。但我想听到一个不同
的
观点。经验丰富
的
数据
科学家如何解决这类问题?
浏览 39
提问于2019-07-23
得票数 0
2
回答
如何在序Logistic回归中保持
缺失
值
、
、
、
、
我在python中使用mord包进行序数logit回归(预测对电影等级1-5星
的
响应)。我
的
预测
变量
之一也是序数,但有一些
值
缺失
,观众跳过一个问题,因为它不适用,因为跳过逻辑从先前
的
问题,或因为他们错过了它。说明
值
“
缺失
”和/或“不适用”
的
最佳方法是什么,同时也保留
这个
预测
变量
的
序号性质?我不认为我应该删除
这个
查看器,或者试图推断
这个
<
浏览 0
提问于2019-10-27
得票数 0
回答已采纳
2
回答
缺少预期
值
的
机器学习
、
、
我有一个有关完成评审的人
的
数据
集
,目标
变量
是评审决定是否正确/不正确,我
的
特性之一是对审阅者进行跟踪4周
的
准确性评分。 然而,这些精确
的
分数并不总是可用
的
。我
的
问题是如何建模这些
数据
-事实上,没有可用
的
准确性评分可能是一个信号。从我对此
的
研究来看,我所看到
的
一切都告诉我,
缺失
的
价值必须被推断或移除。我想知道是否有技术将
浏览 0
提问于2021-01-20
得票数 4
2
回答
大
数据
中
的
推算
、
我需要对缺少
的
值
进行
估算
。我
的
数据
集
大约有800,000行和92个
变量
。我在
r
中
尝试了
估算
包
中
的
kNNImpute,但看起来
数据
集
太大了。在
R
中
还有其他
的
包/方法吗?我不希望使用mean
来
替换缺少
的
值
。谢谢
浏览 3
提问于2013-06-20
得票数 1
1
回答
小鼠
R
模拟
与回归()
、
、
、
、
我正在使用
R
中
的
鼠标包进行多重计算,并试图理解其背后
的
算法。 从它
的
文档来看,老鼠算法被认为是被使用
的
。据我理解,它使用吉布斯采样器
来
执行MCMC,其中
模拟
参数β,它定义了给定Y-(所有其他
变量
都没有Y)
的
Y(带有
缺失
值
的
变量
)
的
条件分布。利用
模拟
β定义了相应
的
条件分布。然后从条件分布中提取值
浏览 1
提问于2015-01-28
得票数 1
1
回答
分配随机
的
缺失
值
我有一个包含
缺失
值
的
数据
集
,我可以使用不同
的
方法
来
估算
缺失
值
。现在我想评估一下
估算
方法
的
精确度。但由于我不知道什么是真的
值
,所以我想在原始
数据
中
掩蔽一些
值
“带有
缺失
值
的
数据
”,然后使用我
的
常规补偿方法。在完成
估算<
浏览 0
提问于2014-01-27
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
【视频】为什么要处理缺失数据?如何用R语言进行缺失值填充?
通过环境影响因子预测生物种群数量
处理缺失值的三个层级的方法总结
使用MICE进行缺失值的填充处理
在R语言中实现Logistic逻辑回归
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券