我有两个独立的数据集(1.300行和2.3000行),有50个交易者6个月的交易观察。在这两个数据集中,我有:交易者id,股票所有权,买卖数量,交易日期,股票部门。
我的目标是在这两个数据集中发现可能的异常值(可疑交易)。
发布于 2019-06-30 14:06:04
我会不假思索地说,这是一个困难的问题,而不包含其他数据。模型只是试图用过去的信息来解释未来的行动。交易员在不同的情况下采取不同的行动。
如果没有他们分析的数据或他们正在分析的股票的财务数据,一个关于交易者以前交易历史的模型将是无效的。除非,如果你描述的“交易员”更像etf基金经理,他们按照一套预先定义的规则操作。
发布于 2019-06-30 16:00:56
关于离群点,
希望这会有帮助。
发布于 2019-11-27 22:08:38
什么叫“离群点”?如果您指的是基于数字的新行为,那么只需逐行进行观察,看看新的观察是否在基于历史数据的安全范围内,并根据新的观察来更新这些边界(因为交易量可能随着时间的增长而增加,您希望考虑到这一点),也许一些RNN会学习行为模式,或者您可以研究Kaggle竞赛的一些解决方案,其中目标是识别可疑的行为。
https://datascience.stackexchange.com/questions/54783
复制相似问题