首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >一种很好的孤立点检测算法

一种很好的孤立点检测算法
EN

Data Science用户
提问于 2019-06-30 12:56:08
回答 3查看 105关注 0票数 0

我有两个独立的数据集(1.300行和2.3000行),有50个交易者6个月的交易观察。在这两个数据集中,我有:交易者id,股票所有权,买卖数量,交易日期,股票部门。

我的目标是在这两个数据集中发现可能的异常值(可疑交易)。

  1. 对于这两个任务,您会推荐什么算法?为什么?
  2. 当我们平均每个交易者只有5-6个交易时,我们能用什么来完成一个任务呢?
EN

回答 3

Data Science用户

发布于 2019-06-30 14:06:04

我会不假思索地说,这是一个困难的问题,而不包含其他数据。模型只是试图用过去的信息来解释未来的行动。交易员在不同的情况下采取不同的行动。

如果没有他们分析的数据或他们正在分析的股票的财务数据,一个关于交易者以前交易历史的模型将是无效的。除非,如果你描述的“交易员”更像etf基金经理,他们按照一套预先定义的规则操作。

票数 1
EN

Data Science用户

发布于 2019-06-30 16:00:56

关于离群点,

  1. 如果您的数据是正态分布的,那么使用Z-得分值,您可以评估每个特征并识别异常值。你也可以参考框-图.所有这些技术都是基于标准差,并帮助您进行异常检测。更多关于Z分的信息
  2. Scikit框架为异常值的检测提供了有趣的方法。如果你可以准备你的数据形式的独立点和离群点样本,那么你可以训练一个模型和评估任何新的样本异常。参考学习:新颖性和离群点检测

希望这会有帮助。

票数 1
EN

Data Science用户

发布于 2019-11-27 22:08:38

什么叫“离群点”?如果您指的是基于数字的新行为,那么只需逐行进行观察,看看新的观察是否在基于历史数据的安全范围内,并根据新的观察来更新这些边界(因为交易量可能随着时间的增长而增加,您希望考虑到这一点),也许一些RNN会学习行为模式,或者您可以研究Kaggle竞赛的一些解决方案,其中目标是识别可疑的行为。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/54783

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档