我即将开始一个关于保险欺诈检测的项目,但是没有依赖变量来训练和分类这个模型。
请提供我可以用来检测汽车和医疗保险行业欺诈的算法。
提前感谢!
发布于 2019-01-23 00:00:29
根据定义,欺诈是一个受监督的概念。
没有一个无监督的算法能够可靠地检测到这一点。最好是使用一些无监督的方法,例如异常检测,得到一些可疑的案例。
发布于 2019-01-23 01:02:58
它通常是一个二元分类问题,即监督学习问题。在这些项目中需要考虑的一件事是欺诈之间的不平衡--没有欺诈标签,前者的情况要少得多。但是如果没有标签,我会先做一些特征工程并应用PCA来检查实例是否存在。
发布于 2019-01-23 08:17:18
自动编码器可用于发现异常(通过重建误差),因此也适用于欺诈检测。本文以自动编码器检测会计舞弊为目标的一个例子是:基于深度自动编码网络的大型会计数据异常检测。
但是,您需要一些方法来验证从这种方法中获得的结果。如果你根本没有标签数据,有专业知识的人将需要查看检测到的异常,以检查它们是否真的是欺诈。
https://datascience.stackexchange.com/questions/44389
复制相似问题