腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(197)
视频
沙龙
2
回答
替换
Python
中
异
常值
的
四分
位数
间
规则
、
、
我正面临一个问题,当用
四分
位数
规则
的
上界和下界
替换
离群值时,内核返回一个错误,说“必须指定axis=0或1”。定义
四分
位
规则
的
函数来
替换
具有上下界
的
异
常值
的
代码如下: def iqr(df): if df[col].dtype !load_boston df = pd.DataFrame(load_boston(
浏览 137
提问于2021-08-08
得票数 1
回答已采纳
1
回答
使用IQR方法查找
python
中
不含中
位数
的
异
常值
、
、
、
我希望计算一个小数据集
的
第一个和第三个
四分
位数
来确定异
常值
: 6,000 13500 15000 15000 17948 虽然理论上计算相当简单,但我发现
python
使用了与我想要
的
方法不同
的
方法(以及Quartile.EXC使用
的
Excel函数)。不同之处在于,
python
在
四分
位数
计算
中
包含了中
位数
。所以对于第一个
四分
位
的
<
浏览 24
提问于2020-03-25
得票数 0
回答已采纳
2
回答
用什么代替离群值?(超级市场交易数据)
、
、
、
我寻找事务3个标准差以上
的
平均值。这些是我
的
离群人。# set threshold above which transaction will be labeled an outlier # this is the还是我
浏览 0
提问于2021-01-22
得票数 2
回答已采纳
1
回答
Weka Explorer
中
的
异
常值
处理
一旦在Weka
中
识别出异
常值
,我应该如何处理这些值,而不是删除它们。例如,一个数据集有一个值从1到1000
的
列credit_balance,在应用了
四分
位数
区间
的
公式后,我们得到了值大于800
的
异常记录。因此,现在我不想删除这些记录,而是希望将值800
替换
为mean 300。我们如何在Weka Explorer
中
做到这一点? 谢谢
浏览 7
提问于2016-09-06
得票数 1
2
回答
箱图R计算异
常值
、
、
[1,] 56 #Lower whisker by boxplot[3,] 107[5,] 173 Below =>1st Qu -(3rd Qu - 1st Qu)*1.5它们
的
计算方式不同
浏览 2
提问于2018-10-29
得票数 3
1
回答
不一致图注行间距绘制pdf在Bookdown
中
、
、
、
、
我正在尝试从以下代码块
中
插入一个数字注释来呈现pdf: ``{r boxfreshAe, out.width = c("49%","49%","49%","49%"),fig.align = "center显示
的
是最小,25个百分
位数
,第55个百分
位数
,75个百分
位数
和最大值.黑点是可能是偏离
规则
±1.5 *
四分
位数
范围
的
异
常值
浏览 2
提问于2018-11-11
得票数 0
回答已采纳
1
回答
R
中
的
F-伪σ/伪标准差函数
、
、
从一开始就没有太多
的
信息。 你们中有谁知道一个包含它
的
包吗?或者它是用包
中
的
函数计算出来
的
?
浏览 0
提问于2019-08-07
得票数 0
回答已采纳
1
回答
Weka
中
不兼容
的
训练和测试集
、
、
我在训练集上执行了以下过滤器, 我在测试数据上使用了"NumerictoNominal“过滤器。测试数据缺少值,而且Class属性也是空
的
。属性
的
数量和顺序在测试和培训数据
中
是相同
的
。
浏览 2
提问于2013-04-01
得票数 1
1
回答
在Dataframe中计算列中值
的
列野值
做这个有什么已知
的
功能吗..?我想把它应用到我
的
数值数据
中
的
某些列,以便用列中间值
替换
离群值。
浏览 3
提问于2015-10-15
得票数 1
回答已采纳
1
回答
我是否可以从我
的
dataframe
中
的
所有列
中
删除离群值?
、
、
、
我有一个有431个变量和140个观测值
的
数据框架,我需要删除异
常值
。但是,这个数据集有几个NA值,我不想删除所有带有NAs
的
行。我试图通过IQR方法去除这个异
常值
,到目前为止,我已经能够通过以下方法获得
四分
位数
和IQR:apply(data,2,quantile, probs=c(0.25,0.75), na.rm=TRUE) -> Quartiles我还
浏览 3
提问于2022-09-30
得票数 -1
回答已采纳
2
回答
基于数字和分类混合数据
的
无监督异常检测
、
、
目前正在考虑
的
变量约为13-15个。我读过,可以扩展分类数据,让变量
中
的
每个类别都为0或1来进行聚类,但是R/
Python
将如何处理这些高维数据呢?面对聚类分析
的
挑战,我还开始尝试将数据切片,一次只看两个变量。例如,我会查看某个员工角色访问
的
浏览 2
提问于2015-07-09
得票数 5
5
回答
清洗时间序列数据
我有一个关于计算机程序每日使用情况
的
时间序列数据,下面是一个例子2017年-11-09: 142017年-11-07:62017年-11-05:0正如你所看到
的
那样,11-06
的
峰值是102。由于我们收集这些数据
的
方式,我们知道数据可能是错误
的
,而且我们确信,根据其他值,102是不正确
的
。有数学方法可以做到这
浏览 0
提问于2017-11-12
得票数 1
回答已采纳
1
回答
我如何找到我
的
文章
的
趋势时间?
、
、
、
、
我们
的
文章是以时间为基础
的
,这意味着我
的
文章更多
的
是在一个特定
的
时间里搜索.如图中所示,这篇文章更多地是在特定时期内搜索
的
。📷📷我需要知道这段时间为明年做好准备。
浏览 0
提问于2019-02-08
得票数 3
3
回答
罗塞塔石挑战:画一个盒子
的
情节
、
、
方框图将显示数据
中
的
四分
位数
和异
常值
,甚至有一个比例尺。您可以使用您
的
语言所拥有的任何类型
的
标准库函数,因为这主要是语言展示。?首先,取数据
的
中
位数
。然后,取所有严格小于中
位数
的
数据点,计算该集合
的</em
浏览 0
提问于2013-04-11
得票数 11
3
回答
查找循环数据
中
的
离群值
、
我知道数据集中
的
大多数值都很接近,但也有一些是异
常值
。我想确定他们
中
的
哪些必须被淘汰。我们在这里看到,在平均值上有一个问题。在计算标准差时也存在这个问题。 我该怎么做呢?
浏览 5
提问于2021-10-18
得票数 2
11
回答
如何从数据集中删除异
常值
、
、
我有一些美貌与年龄
的
多变量数据。年龄
的
范围是20-40,间隔为2 (20,22,24...40),对于每个数据记录,都会给他们一个年龄和一个从1到5
的
美丽评级。当我做这些数据
的
箱形图(X轴上
的
年龄,Y轴上
的
美容评分)时,在每个框
的
胡须之外绘制了一些异
常值
。 我想从数据框本身
中
删除这些异
常值
,但我不确定R如何计算其箱形图
的
异
常值
。下面是我
的
数据可能是什么样子
浏览 2
提问于2011-01-25
得票数 107
回答已采纳
3
回答
工资预测
的
货币规范化
、
、
、
、
我有一个数据集(35万个数据点),其中包含过去10年
中
不同地区员工
的
数据。数据集包括他们
的
技能、他们所处
的
区域、行业、他们目前
的
角色、以各自货币计算
的
工资。经过分析,我发现60%
的
工资是新加坡元,30%是INR,其余
的
是其他15种货币。是建议我为每种货币建立一个模型,还是有一种方法可以将所有货币转换成一个通用
的
值,这样我就可以使用所有的数据点来进行训练了?目前,我已经用SGD
中
的
40%
的</
浏览 0
提问于2021-05-08
得票数 0
2
回答
用
Python
中
的
熊猫清除数据
中
的
异
常值
、
、
、
我想从我
的
数据集中删除异
常值
。看起来是这样
的
:0 2018-11-20 00:00:00 29.8217484 2018-11-20 01:00:00 38.620987当你看这张表时,你可以看到数字5和2是异
常值
我编写了一个
四分
位数
范围(IQR)方法来删除它们。但是,它不起作
浏览 0
提问于2020-04-30
得票数 0
2
回答
识别R
中
数据
中
的
异
常值
、
、
当前
的
数据框架由数值组成。我正在逐列地识别数据
中
的
异
常值
,是否可以立即识别列
中
的
异
常值
并一次删除它们?现在,我正在将值更改为NA。我
的
守则: minq <- sapply(names, function(x) quantiles[[x]OP以dput格式以注释形式发布
的
数据。
浏览 0
提问于2019-06-17
得票数 0
2
回答
位操作-对大量字节
的
操作
、
、
我正在做一些简单
的
文件加密/解密
的
练习,目前我只是读入一堆字节,一次一个地对每个字节执行适当
的
位操作,然后将它们写入输出文件。 这种方法看起来相当慢。是否有更好
的
方法来执行位操作而不是一次执行一个字节?
浏览 0
提问于2011-07-10
得票数 4
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券