腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
查找
包含
离群
值
的
两个
数据
集
之间
的
偏移量
、
、
、
、
假设我有以下按时间戳排序
的
点列表: A = [10, 10, 10, 20, 15, 15, 5, 25] B = [5, 5, 15, 10, 10, 0, 0, 20] 我正在尝试匹配
两个
数组
之间
的
元素,假设有一些未知
的
偏移量
,以及一些不匹配。如果我简单地取这些数组
的
差值,我会得到: C = A - B = [5, 5, -5, 10, 5, 15, 5, 5] 这并没有显示出太多
的
模式。我会这样做: A = [10, 10, 20, 15, 15
浏览 13
提问于2020-01-10
得票数 1
1
回答
SQL Server异常值筛选器
、
、
我正在寻找一种方法来对SQL server中
的
一列
数据
执行基本
的
离群
值
过滤。我有一个日志表,其中
包含
各种操作以及这些操作发生
的
时间。我希望检索
两个
不同日志事件类型
之间
的
平均时间周围
的
一些
数据
。我使用一个简单
的
查询(在时间戳
之间
使用DATEDIFF )来捕获这些事件
之间
的
持续时间。目前,我使用AVG函数来
浏览 1
提问于2012-06-09
得票数 0
回答已采纳
3
回答
多维孤立点
的
发现
、
、
、
、
我正在处理一个非正态分布
的
数据
集
。
数据
集
包含
成本、折扣和利润三个维度。Zscore(cost) + Zscore(profit) - Zscore(discount) 负号
浏览 0
提问于2016-04-30
得票数 2
2
回答
从多维
数据
集中移除异常值&
数据
增强
、
、
、
通过移除IQR范围之外
的
点,可以很容易地消除单个
数据
的
离群
点。但是,如果
数据
集
是由多个维度
的
数据
组成
的
,那么如何检测和删除异常值呢? 下面是我
的
方法:
数据
集
包含
七个不同
的
数据
维度。在从
数据
集中剔除
离群
点后,我绘制了一个多项式回归函数,以找出目标
数据
(有待预测
的</em
浏览 0
提问于2021-10-20
得票数 0
1
回答
DBSCAN
的
ELKI实现中
的
sample_weight选项
、
、
我
的
目标是在
包含
许多近似重复点
的
数据
集中
查找
异常值,并且我希望在此任务中使用DBSCAN
的
ELKI实现。由于我不关心集群本身,而只关心
离群
点(我假设这些
离群
点相对较远),所以我想通过在网格上聚合/二进制点并使用在中实现
的
概念来加快运行时。 你能给出在ELKI中做类似分析
的
最低限度代码吗?假设我
的
数据
集
包含
两列features ( x-y
浏览 2
提问于2019-09-05
得票数 1
回答已采纳
1
回答
多路径(100+)聚类问题中PCA去除孤立点
的
研究
、
、
、
、
我有
两个
数据
处理程序,我需要将这些
数据
聚集到我试图做
的
以下工作中: 使用IQR上括号限制,使用计算
的
MSE分数移除异常值。应用
包含
3个组件
的
PCA来可视化和确
浏览 4
提问于2020-06-23
得票数 0
2
回答
序列分类算法
、
、
、
我想问一下wich算法,我可以用它来进行序列分类,因为我知道我有
两个
类(阳性/negative),但是训练只使用来自一个类
的
数据
(阳性)。 谢谢
浏览 0
提问于2019-04-16
得票数 2
3
回答
如果本地
离群
点因素需要没有异常值
的
训练
数据
,为什么它被归类为无监督
的
?
、
在Scikit-Learn中,局部
离群
因子(LOF)算法被定义为一种无监督异常检测方法。 所以我不明白为什么这个算法需要预先过滤
的
训练
数据
。也许这里
的
“培训
数据
”仅仅意味着“
数据
开始?”但是SciKit- training提供
的
示例代码清楚地显示了没有异常
的
培训
数据
。这是否意味着,如果培训
数据
包含
异常,该模型将无法工作?更重要
的
是,如何使用该算法在训练
数据
中发现异
浏览 0
提问于2019-02-04
得票数 0
回答已采纳
1
回答
回归任务中如何处理不平衡
的
范畴变量?
、
、
、
、
我
的
数据
集
包含
数字和分类预测器。我已经排除了数值变量
的
离群
值
。现在,我想知道如何处理分类变量
的
“异常值”(即不平衡类),但是我在这个主题上找不到任何东西。我是否必须处理不平衡
的
类(
离群
值
),还是只与分类任务相关? 附带注意,如果重要的话:我使用一个热编码对分类变量进行编码。
浏览 0
提问于2022-07-15
得票数 0
2
回答
如何在Matlab中找到两组
数据
之间
的
延迟?
、
、
、
我有两组实验
数据
,它们看起来非常相似,但它们
之间
有一个水平偏移,我认为这是由于仪器设置中
的
一些错误造成
的
。假设它们有y1=f(x1)和y2=f(x2)= f(x1+c)形式,那么确定c
的
最佳方法是什么,这样我就可以考虑到
偏移量
,将
两个
数据
集
叠加成一个
数据
集
。编辑:假设我
的
数据
集
(索引1和2)具有以下形式:y1 =
浏览 9
提问于2017-11-30
得票数 1
回答已采纳
1
回答
关于如何对
数据
和
离群
点进行预处理
的
技巧
、
、
我正在对电信流失
数据
集
进行分析。我有4617个观测结果和17个变量。我正在使用Python。我有以下问题,2)用IQR方法对异常值进行检验时,近700个观测
值
为
离群
值
。我不想删除
离群
点。我是否也应该应用日志转换来处理异常值?这是正确
的</e
浏览 0
提问于2019-07-03
得票数 3
1
回答
异常值检测-缺失
值
、
我面临一个
数据
科学挑战,其中提供了
两个
数据
集
,第一个
数据
集
包含
数天
的
天气
数据
(温度、风速和降水),另一个
数据
集
包含
同一天
的
飞行信息(飞行时间和乘客人数)。飞行
数据
集
可以
包含
同一天
的
多个航班。首先,我们被要求合并这
两个
数据
集
。因此,天气<em
浏览 0
提问于2022-01-15
得票数 0
1
回答
ResultWriter中
的
n个异常值
、
、
我正在处理高维和大
数据
集
,所以我需要从ResultWriter
的
输出中得到顶级N个
离群
值
。在elki中有一些选项可以从这个输出中得到最高
的
N个
离群
值
?
浏览 5
提问于2015-03-03
得票数 2
回答已采纳
1
回答
查找
数据
的
离群
值
、
、
、
我正在尝试找出具有标准差
的
秒
的
异常值。我有
两个
数据
帧,如下所示。我试图找到
的
异常值与每周
的
平均值有1.5个标准差吗?当前代码在
数据
帧下面。
浏览 0
提问于2017-01-08
得票数 1
回答已采纳
1
回答
通过聚类去除噪声,预处理
的
哪一步更好?
、
、
、
数据
集
是一个关于机器学习
的
UCI
数据
集
,有200个观察和2个类。我
的
模型
的
一部分包括以下预处理步骤:在0到1
之间
进行规范化光顺击打 我想使用一种聚类方法来去除噪声
数据
点。问题是,这应该在哪一步发生呢?
浏览 0
提问于2019-12-04
得票数 2
回答已采纳
1
回答
如何使用Python
查找
偏移和比例因子
、
我有一个从传感器产生
的
数据
集
,它给出了一段时间内特定位置
的
压力。我使用
的
传感器是低成本
的
,不是研究分级
的
。我可以访问来自研究传感器
的
数据
集
,并且我
的
数据
集
与研究分级
的
数据
集
之间
存在相关性。然而,也有很大
的
偏移量
和缩放。我想知道是否可以使用Python通过确定
浏览 25
提问于2020-07-09
得票数 0
1
回答
半监督滑雪板学习
、
、
、
我有一个大型
的
多维无标签汽车
数据
集
(价格,里程,马力,.)我想找出
离群
点。我决定使用sklearn来构建决策边界,并且我
的
方法有
两个
主要问题: 现在,我想添加一个手动调节异
浏览 3
提问于2015-03-27
得票数 1
1
回答
部分更改盒图中
的
外列样式
、
、
假设我有以下
数据
集
9.5, 27.9, 7.8, 17.8, 31.4, 25.9, 27.4, 当我在r中画盒子
的
时候我得到了三个
离群
值
7.8、9.5和62,在图中用三个小圆圈作了说明。在这里,我想把最大
离群
点
的
pch,也就是62,变成一个填充
的
圆圈,而不是其他
浏览 0
提问于2018-10-11
得票数 1
回答已采纳
1
回答
如何随机创建异常
数据
集
?
、
我正在尝试创建一个异常
数据
集
,其中
包含
8列,一些列
包含
分类
值
,另一些列
包含
正数值。该
数据
只
包含
两种类型
的
数据
点:普通
数据
点和异常值。我想知道您是否知道有什么工具或库,或者某些方法可以帮助我自动创建这种类型
的
数据
集
。我听说numpy有生成标准发行版
的
工具,但我认为它不能创造绝对价值。 和每一次一样,非常感谢你
的
帮
浏览 3
提问于2019-12-10
得票数 1
回答已采纳
1
回答
交叉验证中
的
第一次分裂
的
误差大于其余
的
分裂。
、
、
、
我试图使用5倍交叉验证来评估不同
的
回归技术,使用以下代码:ElasticNet - split 5 - points mae 0.45 price mae 0.73 当查看输出时,我会怀疑分类器在第一个拆分之后会得到一个较低
的
错误,因为它计算
的
是它之前已经学过
的
一个拆分。但是,我确实在for -循环中创建了一个新
的
分
浏览 0
提问于2018-03-28
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券