腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1176)
视频
沙龙
4
回答
如何
用
R
中
的
第
5和
第
95
百分
位数
替换离群值
、
、
、
我想将我
的
相对较大
的
R
数据集中
的
所有值替换为这些
百分
位数
,它们
的
值分别高于
第
95%和低于
第
5
百分
位数
。我
的
目的是避免完全从数据
中
剪切这些异
常值
。任何建议都将不胜感激,我找不到任何关于
如何
在其他地方这样做
的
信息。
浏览 7
提问于2012-11-12
得票数 9
回答已采纳
1
回答
如何
使用之前和之后
的
数据点对
R
数据集中
的
异
常值
进行平均?
、
、
、
、
我有一个大型数据集,并将异
常值
定义为大于
第
99个
百分
位数
或低于
第
1个
百分
位数
的
值。 我想用它们之前和之后
的
数据点取这些异
常值
的
平均值,然后用新数据集中
的
平均值替换所有3个值。如果有人知道
如何
做到这一点,我将非常感谢您
的
回复。
浏览 1
提问于2012-11-12
得票数 0
回答已采纳
3
回答
如何
去除
R
中
的
第
99个
百分
位数
异
常值
我只想用NA分别替换每个组
的
异
常值
(高于
第
99个
百分
位数
的
值)。我不知道
如何
在不创建一个全新
的
冗余数据帧
的
情况下做到这一点。有什么想法吗?
浏览 35
提问于2020-09-26
得票数 2
回答已采纳
4
回答
负荷运行分析:
第
90
百分
位数
怎么能高于平均水平?
、
、
、
、
我从我运行
的
一份报告
中
获得了一些Loadrunner分析。我刚开始测试。我对
第
90个
百分
位数
的
理解是,如果它取了
第
90个
百分
位数
,而忽略了异
常值
,它就会呈现出一个更真实
的
画面。虽然我看
的
是两个不同
的
报告,但是
第
90个
百分
位数
的
响应时间比总结报告
中
给出
的
平均响
浏览 1
提问于2016-11-29
得票数 2
回答已采纳
1
回答
检测和替换异
常值
、
、
,每个观测值都有相当多
的
异
常值
(一些变量有少量
的
异
常值
,有些有100-200个异
常值
),所以排除数据并不是我想要
的
,因为它会导致我丢失大量数据。我在某处读到使用均值和中
位数
是用于人为
的
异
常值
,但在我
的
例子
中
,我认为异
常值
是自然
的
我实际上打算使用median来
去除
异
常值
,然后使用mean来填充缺失值,但这看起来并不好,
浏览 24
提问于2020-02-25
得票数 0
1
回答
如何
使用Jmeter仪表板报告结果csv文件计算
第
n
百分
位数
?
如何
使用生成
的
J抄仪表板报告CSV文件计算正确
的
第
n
百分
位数
?
第
90次-按延迟(从高到低)重新排序生成
的
CSV文件记录。
去除
最后10%
的
样品,得到最高值。但这与汇总报告90 %
的
值不相等。删除前2077记录从CSV排序后,根据延迟高到低。突出显示
的</em
浏览 7
提问于2021-12-13
得票数 0
1
回答
全景式热图中
如何
设置彩色图中点
、
我正在用Plotly后端绘制一个具有全息视图
的
热图。import holoviews as hv 我想把彩色地图
的
中点设为0,使发散
的
彩色图有意义。在巧妙地,我会做color_continuous_midpoint=0
的
px.imshow函数
的
巧妙表达。Holoview使用px.imshow吗?
如何
在
浏览 5
提问于2021-11-16
得票数 0
1
回答
来自不同数据集
的
百分
位数
组合:这是
如何
实现
的
?
、
、
我需要计算一系列相关但分段
的
数据集
的
第
N
百分
位数
。关于这些数据
的
其他信息:
浏览 1
提问于2011-11-15
得票数 4
1
回答
如何
使用
R
摘要获得
第
n个
百分
位数
?
我可以使用
R
汇总函数得到最小、最大和
百分
位数
(25,75)。
如何
使用汇总来获取任意分
位数
,如汇总统计数据
中
的
第
90个
百分
位数
和
第
99个
百分
位数
?
浏览 48
提问于2013-03-27
得票数 30
1
回答
移除高于时间序列剖面平均值
的
3SD以上
的
异
常值
去除
偏离值(按列)以上
的
3个标准偏差
的
中
位数
在
R
与多列在一个时间序列。我想移除有异
常值
的
行。 在下面的例子
中
,最后一行将被删除,因为B列中有一个异
常值
。
浏览 4
提问于2022-05-02
得票数 0
1
回答
使用基于日志
的
度量和Regex创建分布度量
、
、
、
、
我正在尝试创建一个从一些日志
中
的
字符串中提取
的
度量。然后输入我
的
公制
的
字段名。在这里没有问题,因为我可以在建议
的
值中找到它。 现在,该字段将返回一个带有一些查询参数
的
字符串。我希望将这些查询参数之一
的
值转换为度量。为此,我添加了一个正则表达式。我
的
字符串看起来如下:https://
浏览 7
提问于2021-07-15
得票数 1
回答已采纳
1
回答
Boxplot已损坏,仅显示一行
、
、
因此,我
的
数据集中在不同
的
处理方法以及它们
如何
影响种子萌发
的
一天。 不久前,当我在
R
中
制作小提琴曲线图以根据处理显示发芽时间
的
分布时,我试图添加一个框图作为描述性统计,但只遇到了一条线。我联系了许多人,他们根本不知道问题是什么,我在另一个小提琴图中使用了同样
的
数据,作为更大
的
数据收集
的
一部分,包括这个更多
的
处理。我从这里开始,发现它很奇怪,现在当我在SPSS
中
执行统计测试时,我遇到
浏览 17
提问于2020-05-28
得票数 0
1
回答
基于RStudio窗口大小和绘图方法
的
绘图外观变化
我正在尝试使用vioplot包绘制
R
中
的
分布;我
的
图由点
的
散点图组成,小提琴图(表示这些点
的
“箱”)绘制在散点图
的
顶部。 但是,绘制数据
的
不同方法会导致绘图中
的
特征略有不同。如果所有小提琴曲线图都是使用循环绘制
的
,小提琴曲线图
的
尾部将向下延伸到最低点,但如果单独绘制,小提琴曲线图
的
尾部将不会到达异
常值
。此外,调整绘图窗口大小(然后重新打印)还会更改小提琴绘图尾部<
浏览 36
提问于2020-10-01
得票数 0
回答已采纳
1
回答
计算
百分
位数
我需要一个小程序:然后打印x
的
大小(与
r
0,
r
1,
r
2,.,rn )相关
的
百分
位数
。我读过很多关于
百分
位数
的
文章,但我还是不明白,所以也许有人会向我解释我需要做什么,或者告诉我
如何
计算这个
百分
位数
。我对C语言有一点了解,所以如果som
浏览 7
提问于2012-05-21
得票数 1
回答已采纳
5
回答
使用
百分
位数
消除Pandas DataFrame
中
的
异
常值
、
、
我有一个包含40列和许多记录
的
DataFrame df。.| Col39给我到目前为止
的
代码:new_df =df[(df.Col1 > P[0
浏览 3
提问于2016-03-06
得票数 28
回答已采纳
1
回答
不一致图注行间距绘制pdf在Bookdown
中
、
、
、
、
我正在尝试从以下代码块
中
插入一个数字注释来呈现pdf: ``{
r
boxfreshAe, out.width = c("49%","49%","49%","49%"),fig.align = "center显示
的
是最小,25个
百分
位数
,
第
55个
百分
位数
,75个
百分
位数
和最大值.黑点是可能是偏离规则±1.5 *四分
位数</
浏览 2
提问于2018-11-11
得票数 0
回答已采纳
2
回答
boxen情节与盒子情节有何不同?
、
、
、
我想知道为什么在海里出生
的
图书馆里有盒子情节,为什么会有博克森情节呢?我知道boxen绘图优化了一种表示数据
的
方法,特别是对于大型数据集,但是我不知道为什么,另外,我没有任何充分
的
理由使用boxen图。
浏览 0
提问于2018-09-19
得票数 13
回答已采纳
1
回答
在我训练机器学习模型时,标准化/规范化是减少离群值影响
的
好方法吗?
、
、
、
最近,我阅读了一些论文,其中作者指出,他们已经对变量进行标准化/规范化,以减少数据训练
的
机器学习模型
中
的
异
常值
的
影响。 说得通吗?为什么?我认为,在标准化之后,异
常值
与其他值之间
的
差异仍然存在于数据
中
。
浏览 0
提问于2021-09-29
得票数 1
回答已采纳
1
回答
如何
:从stddev/mean计算中排除一行并在以后加入
因此,我试图找到一些机器,与它们
的
环境和功能相比,它们会抛出异常多
的
异常。直觉是,负载和任务类型在整个组
中
应该是相当相似的,所以如果一台机器抛出更多
的
异常,它可能处于某种糟糕
的
状态,应该得到服务。这对于大型机器组很好,但是对于较小
的
组存在一个问题:如果很少有机器,而且其中只有一台会抛出很多异常,那么它可能不会被检测到。原因是,由于该数据点是组
的
一般stddev和平均计算
的
部分,所以平均值和stddev偏向于这个离群值。解决方案是从计算
的</em
浏览 1
提问于2018-11-14
得票数 0
回答已采纳
1
回答
使用分
位数
回归和Python识别异
常值
、
、
、
、
我试图使用回归线
的
第
5和
第
95个
百分
位数
来识别数据集中
的
异
常值
,因此我在Python
中
对statsmodel、matplotlib和pandas使用分
位数
回归。基于来自blokeley
的
,我可以创建我
的
数据
的
散点图,并基于分
位数
回归显示最佳拟合线以及第5和
第
95
百分
位数
的
线。但我
如何<
浏览 5
提问于2018-08-11
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习数据预处理方法与技巧系统讲解
数据信息汇总的7种基本技术总结
Ceph RBD 性能及 IO 模型统计追踪功能设计与实现
在Python中进行探索式数据分析
基因芯片小知识(二)数据分析
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券