如何去除R中的第99个百分位数异常值_如何得到R中分布的第n个百分位数？_如何确定R中样本中给定值的百分位数 - 腾讯云开发者社区

、、、

我想将我的相对较大的R数据集中的所有值替换为这些百分位数，它们的值分别高于第95%和低于第5百分位数。我的目的是避免完全从数据中剪切这些异常值。任何建议都将不胜感激，我找不到任何关于如何在其他地方这样做的信息。

浏览 7提问于2012-11-12得票数 9

回答已采纳

1回答

如何使用之前和之后的数据点对R数据集中的异常值进行平均？

、、、、

我有一个大型数据集，并将异常值定义为大于第99个百分位数或低于第1个百分位数的值。我想用它们之前和之后的数据点取这些异常值的平均值，然后用新数据集中的平均值替换所有3个值。如果有人知道如何做到这一点，我将非常感谢您的回复。

浏览 1提问于2012-11-12得票数 0

回答已采纳

3回答

如何去除R中的第99个百分位数异常值

我只想用NA分别替换每个组的异常值(高于第99个百分位数的值)。我不知道如何在不创建一个全新的冗余数据帧的情况下做到这一点。有什么想法吗？

浏览 35提问于2020-09-26得票数 2

回答已采纳

4回答

负荷运行分析:第90百分位数怎么能高于平均水平？

、、、、

我从我运行的一份报告中获得了一些Loadrunner分析。我刚开始测试。我对第90个百分位数的理解是，如果它取了第90个百分位数，而忽略了异常值，它就会呈现出一个更真实的画面。虽然我看的是两个不同的报告，但是第90个百分位数的响应时间比总结报告中给出的平均响

浏览 1提问于2016-11-29得票数 2

回答已采纳

1回答

检测和替换异常值

、、

，每个观测值都有相当多的异常值(一些变量有少量的异常值，有些有100-200个异常值)，所以排除数据并不是我想要的，因为它会导致我丢失大量数据。我在某处读到使用均值和中位数是用于人为的异常值，但在我的例子中，我认为异常值是自然的我实际上打算使用median来去除异常值，然后使用mean来填充缺失值，但这看起来并不好，

浏览 24提问于2020-02-25得票数 0

1回答

如何使用Jmeter仪表板报告结果csv文件计算第n百分位数？

如何使用生成的J抄仪表板报告CSV文件计算正确的第n百分位数？第90次-按延迟(从高到低)重新排序生成的CSV文件记录。去除最后10%的样品，得到最高值。但这与汇总报告90 %的值不相等。删除前2077记录从CSV排序后，根据延迟高到低。突出显示的</em

浏览 7提问于2021-12-13得票数 0

1回答

全景式热图中如何设置彩色图中点

、

我正在用Plotly后端绘制一个具有全息视图的热图。import holoviews as hv 我想把彩色地图的中点设为0，使发散的彩色图有意义。在巧妙地，我会做color_continuous_midpoint=0的px.imshow函数的巧妙表达。Holoview使用px.imshow吗？如何在

浏览 5提问于2021-11-16得票数 0

1回答

来自不同数据集的百分位数组合:这是如何实现的？

、、

我需要计算一系列相关但分段的数据集的第N百分位数。关于这些数据的其他信息：

浏览 1提问于2011-11-15得票数 4

1回答

如何使用R摘要获得第n个百分位数？

我可以使用R汇总函数得到最小、最大和百分位数(25，75)。如何使用汇总来获取任意分位数，如汇总统计数据中的第90个百分位数和第99个百分位数？

浏览 48提问于2013-03-27得票数 30

1回答

移除高于时间序列剖面平均值的3SD以上的异常值

去除偏离值(按列)以上的3个标准偏差的中位数在R与多列在一个时间序列。我想移除有异常值的行。在下面的例子中，最后一行将被删除，因为B列中有一个异常值。

浏览 4提问于2022-05-02得票数 0

1回答

使用基于日志的度量和Regex创建分布度量

、、、、

我正在尝试创建一个从一些日志中的字符串中提取的度量。然后输入我的公制的字段名。在这里没有问题，因为我可以在建议的值中找到它。现在，该字段将返回一个带有一些查询参数的字符串。我希望将这些查询参数之一的值转换为度量。为此，我添加了一个正则表达式。我的字符串看起来如下：https://

浏览 7提问于2021-07-15得票数 1

回答已采纳

1回答

Boxplot已损坏，仅显示一行

、、

因此，我的数据集中在不同的处理方法以及它们如何影响种子萌发的一天。不久前，当我在R中制作小提琴曲线图以根据处理显示发芽时间的分布时，我试图添加一个框图作为描述性统计，但只遇到了一条线。我联系了许多人，他们根本不知道问题是什么，我在另一个小提琴图中使用了同样的数据，作为更大的数据收集的一部分，包括这个更多的处理。我从这里开始，发现它很奇怪，现在当我在SPSS中执行统计测试时，我遇到

浏览 17提问于2020-05-28得票数 0

1回答

基于RStudio窗口大小和绘图方法的绘图外观变化

我正在尝试使用vioplot包绘制R中的分布；我的图由点的散点图组成，小提琴图(表示这些点的“箱”)绘制在散点图的顶部。但是，绘制数据的不同方法会导致绘图中的特征略有不同。如果所有小提琴曲线图都是使用循环绘制的，小提琴曲线图的尾部将向下延伸到最低点，但如果单独绘制，小提琴曲线图的尾部将不会到达异常值。此外，调整绘图窗口大小(然后重新打印)还会更改小提琴绘图尾部<

浏览 36提问于2020-10-01得票数 0

回答已采纳

1回答

计算百分位数

我需要一个小程序：然后打印x的大小(与r0，r1，r2，.，rn )相关的百分位数。我读过很多关于百分位数的文章，但我还是不明白，所以也许有人会向我解释我需要做什么，或者告诉我如何计算这个百分位数。我对C语言有一点了解，所以如果som

浏览 7提问于2012-05-21得票数 1

回答已采纳

5回答

使用百分位数消除Pandas DataFrame中的异常值

、、

我有一个包含40列和许多记录的DataFrame df。.| Col39给我到目前为止的代码：new_df =df[(df.Col1 > P[0

浏览 3提问于2016-03-06得票数 28

回答已采纳

1回答

不一致图注行间距绘制pdf在Bookdown中

、、、、

我正在尝试从以下代码块中插入一个数字注释来呈现pdf： ``{r boxfreshAe, out.width = c("49%","49%","49%","49%"),fig.align = "center显示的是最小，25个百分位数，第55个百分位数，75个百分位数和最大值.黑点是可能是偏离规则±1.5 *四分位数</

浏览 2提问于2018-11-11得票数 0

回答已采纳

2回答

boxen情节与盒子情节有何不同？

、、、

我想知道为什么在海里出生的图书馆里有盒子情节，为什么会有博克森情节呢？我知道boxen绘图优化了一种表示数据的方法，特别是对于大型数据集，但是我不知道为什么，另外，我没有任何充分的理由使用boxen图。

浏览 0提问于2018-09-19得票数 13

回答已采纳

1回答

在我训练机器学习模型时，标准化/规范化是减少离群值影响的好方法吗？

、、、

最近，我阅读了一些论文，其中作者指出，他们已经对变量进行标准化/规范化，以减少数据训练的机器学习模型中的异常值的影响。说得通吗？为什么？我认为，在标准化之后，异常值与其他值之间的差异仍然存在于数据中。

浏览 0提问于2021-09-29得票数 1

回答已采纳

1回答

因此，我试图找到一些机器，与它们的环境和功能相比，它们会抛出异常多的异常。直觉是，负载和任务类型在整个组中应该是相当相似的，所以如果一台机器抛出更多的异常，它可能处于某种糟糕的状态，应该得到服务。这对于大型机器组很好，但是对于较小的组存在一个问题:如果很少有机器，而且其中只有一台会抛出很多异常，那么它可能不会被检测到。原因是，由于该数据点是组的一般stddev和平均计算的部分，所以平均值和stddev偏向于这个离群值。解决方案是从计算的</em

浏览 1提问于2018-11-14得票数 0

回答已采纳

1回答

使用分位数回归和Python识别异常值

、、、、

我试图使用回归线的第5和第95个百分位数来识别数据集中的异常值，因此我在Python中对statsmodel、matplotlib和pandas使用分位数回归。基于来自blokeley的，我可以创建我的数据的散点图，并基于分位数回归显示最佳拟合线以及第5和第95百分位数的线。但我如何<

浏览 5提问于2018-08-11得票数 3

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何用R中的第5和第95百分位数替换离群值

如何使用之前和之后的数据点对R数据集中的异常值进行平均？

如何去除R中的第99个百分位数异常值

负荷运行分析:第90百分位数怎么能高于平均水平？

检测和替换异常值

如何使用Jmeter仪表板报告结果csv文件计算第n百分位数？

全景式热图中如何设置彩色图中点

来自不同数据集的百分位数组合:这是如何实现的？

如何使用R摘要获得第n个百分位数？

移除高于时间序列剖面平均值的3SD以上的异常值

使用基于日志的度量和Regex创建分布度量

Boxplot已损坏，仅显示一行

基于RStudio窗口大小和绘图方法的绘图外观变化

计算百分位数

使用百分位数消除Pandas DataFrame中的异常值

不一致图注行间距绘制pdf在Bookdown中

boxen情节与盒子情节有何不同？

在我训练机器学习模型时，标准化/规范化是减少离群值影响的好方法吗？

如何:从stddev/mean计算中排除一行并在以后加入

使用分位数回归和Python识别异常值

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐