腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何
删除
同时
包含
分类
数据
和
数值
数据
的
数据
集中
的
异
常值
?
、
、
、
、
我正在尝试从
数据
集中
的
“Price”列中
删除
异
常值
。我已经能够使用其他列中
的
相应值创建离群值
的
数据
框,但我正在努力从父
数据
集中
排除这些条目。我该怎么做呢?这是我用来创建上面提到
的
新
数据
帧
的
代码: lower_limit = pq1 - 1.5 *iqr newdf = df[((df['pric
浏览 39
提问于2020-09-25
得票数 0
1
回答
如何
使用二元盒图从
数据
集中
删除
异
常值
、
、
、
我有一个
数据
集(见下文),它由多个变量组成,其中两个是'manu‘
和
'popul’,它们都
包含
数值
。 然后从这幅图中我可以看到有一些异
常值
,我能够使用下面的代码识别出哪些值是异
常值
,我还将显示哪些值是异
常值
:
浏览 4
提问于2021-03-16
得票数 0
回答已采纳
1
回答
Python/Pandas:
删除
带有外围值
的
行,保留所有列
、
、
我有一个
包含
许多
数值
和
分类
值
的
数据
集,我只想测试
数值
列上
的
外围值,并根据这些列
删除
行。我就是这样尝试
的
:但是,它将
删除
所有列中
的
所有外围值,当然,因为我有
分类
列,因此遇到以下错误:TypeError:不支持
的
操作数类型(S)用于+:
浏览 0
提问于2018-03-20
得票数 1
回答已采纳
2
回答
在机器学习算法
的
特征准备中何时去除离群点
、
我有一个
数值
变量(价格),它在训练
和
测试
数据
集中
都有一个长尾。我发现,如果
删除
这个变量在训练
和
测试
数据
集中
的
最高值1%,那么这个变量
的
直方图
和
测试
数据
集看起来基本相同。见下图。📷 我
的
问题是:我仍然需要使用训练
数据
(包括特性
和
标签)对测试
数据
进行预测(仅使用特性)。在这种情况下,我应该
如何
处理
浏览 0
提问于2018-03-06
得票数 5
回答已采纳
1
回答
我是否可以在训练中将自然离群值保留在
数据
集中
?
、
、
我是否可以将未经编辑
的
自然离群值保留在
数据
集中
(不只是因为
数据
中错误输入而出现
的
异
常值
)?或者我也应该移除它们或者改变它们?
浏览 0
提问于2021-12-24
得票数 0
回答已采纳
1
回答
删除
异
常值
、
我有一个
包含
2000多个观察值
的
大型
数据
集。这些
数据
涉及动物组织中
的
毒素浓度。我
的
响应变量是myRESULT,并且我对每个感兴趣
的
ANALYTE都有多个观察值。我需要从每个ANALYTE组中
删除
离均值超过三个SD
的
数值
。 虽然我意识到我通常不应该从
数据
集中
删除
异
常值
,但我仍然想知道
如何
在R中做到这一点。 下面是我
的</e
浏览 17
提问于2019-01-13
得票数 0
1
回答
在使用LIME解释模型时处理类别、浮点
和
int类型
的
特性
、
、
、
、
我正在使用Lime (局部可解释模型-不可知论解释)与混合特征类型,以评估我
的
模型预测
的
分类
任务。是否有人知道
如何
在lime.lime_tabular.LimeTabularExplainer()方法中指定二进制特性。石灰实际上
如何
处理这些类型
的
特性(只有1
和
0
的
更多特性)?
浏览 6
提问于2020-09-30
得票数 0
回答已采纳
1
回答
异
常值
处理
、
我有一个大
的
>100列
的
数据
集,其中
包含
几乎所有类型
的
数据
。我想从我
的
数据
集中
删除
离群值,为此我决定使用IQR。问题是,即使我应用0.25/0.75
的
分位数,我仍然会在ClientTotalIncome等列中得到大量
的
异
常值
。进一步地,我消除了超过90%
的
数据
。我在Python中
删除
异
常
浏览 0
提问于2019-01-29
得票数 0
回答已采纳
2
回答
在特征上受到大量异
常值
影响
的
分类
?你
如何
处理离群点?
、
、
我正在研究一个
分类
问题,我发现我
的
数据
有很多异
常值
,这降低了我
的
识别率。我试过重新标度,标准化技术,如最小最大,盒考克斯,甚至日志转换。我正在考虑从方框图中
删除
异
常值
,但我担心我可能会
删除
定义模型所需
的
有用特性/
数据
。 有没有人建议
如何
处理这类案件。对
数据
的
进一步分析表明,我
的
数据
构成
的
特性属于不同<
浏览 0
提问于2017-05-07
得票数 1
2
回答
如何
管理多个
数据
集-机器学习Azure
、
是否存在接受多个
数据
集进行处理
的
模块?例如,“拆分
数据
”、“编辑元
数据
”
和
“选择
数据
集中
的
列”不接受多个
数据
集作为输入。 这就是我所做
的
:在我
的
模型中有几个数字
和
分类
变量。我使用“转换为指示器变量”模块为我
的
数据
创建虚拟变量。
如何
将指标变量和
数值
变量
包含
到一个
数据</
浏览 28
提问于2019-04-11
得票数 0
1
回答
R异
常值
程序
、
、
、
我想写一个从我
的
数据
集中
删除
异
常值
的
程序。这段代码显示了异常行数
和
列数,但没有从我
的
数据
集中
删除
它们:out <- outlier(Practice_data[,2:4], logical=TRUE)Practice_data[which(out[,], TRUE)] which(out[,], TR
浏览 8
提问于2016-09-23
得票数 0
1
回答
回归任务中
如何
处理不平衡
的
范畴变量?
、
、
、
、
我
的
数据
集
包含
数字
和
分类
预测器。我已经排除了
数值
变量
的
离群值。现在,我想知道
如何
处理
分类
变量
的
“异
常值
”(即不平衡类),但是我在这个主题上找不到任何东西。我是否必须处理不平衡
的
类(离群值),还是只与
分类
任务相关? 附带注意,如果重要的话:我使用一个热编码对
分类
变量进行编码。
浏览 0
提问于2022-07-15
得票数 0
1
回答
转换一些变量而不是其他变量是很好
的
做法吗?
、
、
、
我有一个
数据
集,其中
包含
编码为
数值
的
分类
变量、其他连续且有许多异
常值
的
变量,以及具有相当正态分布
的
其他连续变量。我正计划使用sklearn预处理方法.PowerTransformer来对所有这些列进行转换,但也许只对那些没有正态分布
的
列
和
许多异
常值
使用它可能更有意义?这是一个
分类
问题(泰坦尼克号机器学习问题)。
浏览 0
提问于2021-02-21
得票数 1
回答已采纳
3
回答
在R中将Yes
和
No转换为0
和
1
、
、
在R中
包含
20个变量
和
3144个观测值
的
数据
集中
,
如何
将
分类
值(Yes/No)转换为
数值
(0/1)?
浏览 2
提问于2016-04-19
得票数 1
1
回答
测试
和
列车组中
的
特征工程(组合
数据
或列车
和
测试分开)
、
、
背景:作为预测分析
的
一部分,我得到了一个训练
和
测试
数据
集。训练
数据
和
测试
数据
都有
数值
和
分类
预测变量,另外,训练
数据
有一个
数值
目标变量。目的是在测试中预测目标。train = C1,c2,x3,x4,y = Xc,X,y Xc,X表示范畴变量和
数值
预测变量。我试图从
分类
变量Xc中生成额外
的
特性,
浏览 0
提问于2018-06-05
得票数 1
2
回答
从熊猫
数据
中
删除
已知
的
离群点
、
在熊猫
的
数据
子
集中
(在这里,我
的
异
常值
)应该被
删除
:df = data[~(data.outlier1 == 1)] df = data[~((data.outlier1 == 1) or (data.outlier2 == 1) or (data.outlier3 == 1))] 其想法是
同时
减去所有的异
常值
(编码在不同<e
浏览 7
提问于2015-10-06
得票数 1
回答已采纳
1
回答
异
常值
检测-缺失值
、
我面临一个
数据
科学挑战,其中提供了两个
数据
集,第一个
数据
集
包含
数天
的
天气
数据
(温度、风速
和
降水),另一个
数据
集
包含
同一天
的
飞行信息(飞行时间
和
乘客人数)。飞行
数据
集可以
包含
同一天
的
多个航班。我有几个关于离群点检测
的
问题: 由于许多天气
数据
值将在大
数据
集中
重复,所以是首先在天气
浏览 0
提问于2022-01-15
得票数 0
2
回答
从多维
数据
集中
移除异
常值
&
数据
增强
、
、
、
通过移除IQR范围之外
的
点,可以很容易地消除单个
数据
的
离群点。但是,如果
数据
集是由多个维度
的
数据
组成
的
,那么
如何
检测
和
删除
异
常值
呢? 下面是我
的
方法:
数据
集
包含
七个不同
的
数据
维度。当在dataframe上显示时,有七个不同
的
列;每一行充当解释单个
数据
属性
的
元
浏览 0
提问于2021-10-20
得票数 0
1
回答
删除
PHP中
的
低离群值
、
、
我一直在使用这个将
数据
集中
的
异
常值
去除到1。我
如何
编辑上面链接
的
答案中
的
代码,以
删除
较低
的
异
常值
?
浏览 2
提问于2016-07-05
得票数 2
1
回答
从
数据
集中
删除
异
常值
、
使用One-class SVM或Elliptic Envelope识别
数据
集中
的
异
常值
之后,
如何
使用这些模型从
数据
集中
删除
异
常值
? 就是我要看
的
例子。
浏览 1
提问于2015-07-25
得票数 8
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券