腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
为什么
将
分类
数据
集中
的
缺失
值
替
换为
-
99999
、
正在处理
分类
问题,缺少用'?‘表示
的
值
,那么
为什么
是-
99999
? df.replace('?',-
99999
,inplace=True)
浏览 20
提问于2021-05-13
得票数 0
1
回答
WEKA :如何消除“
缺失
”和“不适用”
的
数字
数据
?
、
、
、
、
我是维卡新来
的
。例如对于“
缺失
值
”,我可以用'?我
的
问题是:- 1)我们如何告诉WEKA在计算平均值或std
值
时不包括“不适用”
值
?
浏览 4
提问于2013-10-21
得票数 0
2
回答
缺失
值
推算
、
如果在
数据
集中
分类
变量和连续变量都有
缺失
值
,我如何通过
将
分类
变量替
换为
mode并将连续变量替
换为
mean来处理它们?
浏览 1
提问于2018-03-06
得票数 0
1
回答
当某些特征未知时,训练
分类
器
、
、
、
我正在用我创建
的
数据
集在Matlab中训练一个
分类
器。不幸
的
是,
数据
集中
的
一些特性没有被记录下来。class1: 10 1 12 -
99999
6 8... class2: 5 -
99999
4 3 2 -
99999
以此类推,-
浏览 0
提问于2019-04-15
得票数 4
回答已采纳
1
回答
将
因子分配给R中矩阵中
的
列
、
、
、
我正在尝试使用missForest包
将
丢失
的
数据
计算到一个相当大
的
数据
集中
。有人知道如何<
浏览 2
提问于2017-11-30
得票数 0
1
回答
使用C4.5技术时对
缺失
值
的
处理
、
、
、
我正在尝试使用一些
分类
技术来构建一个
分类
器“模型”。从C4.5技术开始,面临
缺失
值
的
问题,因此:“我应该留下来吗?”在
缺失
的
属性中?
浏览 4
提问于2015-04-25
得票数 0
1
回答
如何在R中使用missForest包来处理测试
数据
?
我们基本上可以使用missForest包来输入R中
的
缺失
值
(对于
分类
和数字).But,这种方法需要一个完整
的
响应变量来训练森林。那么,如何使用这个missForest包估算测试
数据
集中
的
缺失
值
,因为我们在测试
数据
集中
没有任何response变量?
浏览 0
提问于2015-11-18
得票数 1
1
回答
将
数值数组中
的
NaN转
换为
大数字(例如
99999
)
、
我想将numpy数组中
的
NaN替
换为
较大
的
数字,如
99999
。我不想使用numpy.nan_to_num
将
NaN替
换为
0,因为我想区分NaN
值
和
数据
集中
已经存在
的
0
值
。
浏览 2
提问于2016-11-02
得票数 3
1
回答
如何使用在训练
数据
集上创建
的
自定义输入程序来计算测试
集中
缺少
的
值
、
、
、
、
其中一个输入特性具有空
值
,我已经在其上应用了自定义估算技术。在此技术下,我
将
丢失
的
值
替
换为
目标特性
的
两个类别的平均值。fillna(dataframe.groupby('Target Feature')['Feature'].transform('mean')) 利用这种策略,设计了基于Logistic回归和支持向量
分类
器
的
分类
模型现在,我不得不在测试集上运行我
的</
浏览 0
提问于2021-01-18
得票数 1
1
回答
MNAR型
缺失
值
连续变量
、
我有连续变量(天气特征),缺少MNAR类型
的
值
(一个不同
的
分布,有和没有
缺失
的
值
)。我了解到,这些变量应该通过添加一个“
缺失
”类别来转
换为
分类
。例如:包含MNAR
缺失
值
的
云覆盖特性被转
换为
具有以下子类
的
分类
特性:“非常高”、“高”、“中等”、“低”、“非常低”、“失踪”:我想检查季节性和趋势(时间序列
数据
浏览 0
提问于2022-08-04
得票数 1
回答已采纳
5
回答
将
所有类别变量
的
missing替
换为
'None‘
、
、
我想将我
的
数据
集中
所有
分类
变量
的
缺失
值
转
换为
'None‘。我有100多个因子变量,我想一次完成所有这些变量,而不是在代码中使用它们
的
名称。假设我有以下
数据
集(仅作为示例),并且我想将所有因子变量(如"x“和"y”)
的
‘NA’替
换为
'None‘。
浏览 0
提问于2019-07-24
得票数 1
1
回答
not NC无助于对我
的
混合连续/
分类
数据
集进行过采样。
、
、
当我使用SMOTE对四类
分类
问题中
的
三类进行过采样时,针对少数类
的
Prec、Recall和F1度量仍然很低(~3%)。我
的
数据
集中
有32个
分类
变量和30个连续变量。所有的
分类
变量已被转
换为
二进制列使用一热编码。此外,在进行过采样处理之前,我将使用Iterativeimputer计算所有
缺失
的
值
。关于
分类
器,我使用
的
是logistic回归,随机森林
浏览 0
提问于2019-08-09
得票数 0
1
回答
分类
问题中大量NAs
的
处理
、
、
、
然而,这样做,我
将
失去一些功能,似乎是非常重要
的
这一
分类
工作基础上
的
数据
探索性分析。作为一个例子,有一个变量
的
64%
的
缺失
值
,但它可以
分类
样本
的
AUC 95% CI:73.23 72.86 - 73.61。我确实想保留这类变量。另一方面,保持
缺失
值
需要使用可以像k-NN、朴素贝叶斯和随机森林那样处理
的
算法。但这些算法
的
sklea
浏览 0
提问于2021-08-24
得票数 1
4
回答
我想用Python
将
范畴变量转
换为
数字变量。
、
、
、
我有一个有绝对变量
的
数据
。我希望使用以下逻辑将它们转
换为
数字:List_A = ['A','B','C','D','E'] 我需要用3代
浏览 3
提问于2018-10-24
得票数 1
回答已采纳
1
回答
使用错误
的
熊猫缺少
的
值
=‘胁迫’
、
我希望使用以下命令计算以下
数据
的
缺失
值
。它未能检测到
缺失
的
值
。df[cols].apply(pd.to_numeric, errors='coerce')print(missing) 它起了作用,但它也
将
“BinaryObject”
分类
响应变量转
换为
NAN。如果我在多列中有
分类
变量,而
浏览 0
提问于2020-05-07
得票数 2
回答已采纳
1
回答
Sklearn:可以在NaN中为未知类别指定null或OneHotEncoder
值
吗?
、
、
、
、
我正在处理一个混合
的
分类
变量和数字变量
的
数据
集。有很多
缺失
的
数据
,因此,我希望通过
分类
器进行一些估算。我希望
将
一个numpy数组传递到fast_knn中,该数组包含对
分类
变量
的
一个热编码,为
缺失
的
值
设置np.nan,与数字属性中
的
数据
混合(对于
缺失
的
值
也使用
浏览 2
提问于2021-03-30
得票数 1
回答已采纳
1
回答
随机森林回归中
缺失
分类
特征
值
处理指南
、
在使用随机森林回归器(或任何集成学习者)时,处理丢失
的
分类
特征
值
的
一般准则是什么?我知道scikit学习有归并函数(如mean...strategy或邻近)来推断
缺失
的
值
(数字)。但是,一个人如何处理
缺失
的
分类
价值:比如工业(石油、计算机、汽车、None)、专业(学士、硕士、博士、None)。 如有任何建议,将不胜感激。
浏览 2
提问于2016-05-13
得票数 1
2
回答
管理目标变量中
的
NaN (测试)
、
、
、
、
请有人告诉我如何在我
的
目标变量中处理NaN?在Y_test中求零(0)清空Y_testTypeError:“int”和“str”
的
实例之间不支持< 请帮帮我!
浏览 0
提问于2019-11-20
得票数 1
1
回答
如何使用文本
数据
清理
数据
集并将其用于
分类
、
、
我正在研究
数据
集上
的
性别
分类
器,其中包含了许多
缺失
的
值
和更多
的
范畴values.How,我是否应该
将
分类
值
转
换为
数值,以及应该使用哪种算法来获得更高
的
精度?
浏览 1
提问于2017-12-28
得票数 0
回答已采纳
1
回答
随机森林与Logistic回归
我正在处理一个
数据
集。这是一个
分类
问题。
数据
集中
的
一列在总共300 k观测
值
中有大约11000个
缺失
值
(它是一个范畴变量,因此不可能像数值那样计算
缺失
值
)。在随机森林不受
缺失
值
影响
的
情况下,采用随机森林而不是Logistic回归是明智
的
吗? 另外,在使用RF时,我是否需要考虑自变量之间
的
多重共线性,还是不需要这样做?
浏览 2
提问于2019-04-14
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
【视频】为什么要处理缺失数据?如何用R语言进行缺失值填充?
非 0即1,如何将庞大 Excel 数据表中的所有非 0 值批量替换为 1?
机器学习入门案例分析-泰坦尼克号生存预测
机器学习100天:第1天
处理缺失值的三个层级的方法总结
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券