eBay的AI可以识别40%的“高精度”信用卡欺诈案例

信用卡欺诈比您想象的更常见。2014年,在1760万起执法身份盗窃事件中,86%的受害者报告与现有信用卡或银行账户有关的欺诈行为。事实上,根据联邦贸易委员会的统计,信用卡欺诈是美国 最常见的身份盗用形式,每年有超过130,000份报告。

检测可疑卡使用模式的自动方法并不是什么新鲜事,但eBay的研究人员在预印本服务器Arxiv上发表的一篇新论文(“ 电子商务中的信用卡欺诈检测:异常检测方法 ”)中描述了一种尖端技术。有机 他们提议的系统使用经过训练的算法来识别“良好行为”,因为它涉及交易和支付,并标记超出预期规范的活动

“通常,与欺诈和垃圾邮件检测等任务相关的挑战是缺乏训练合适的监督学习模型所需的所有可能模式,”该论文的作者写道。“当欺诈模式不仅稀缺时,这个问题更加突出,它们也随着时间而变化......有限的数据和不断变化的模式使得学习变得非常困难。我们假设良好行为不随时间变化,表示良好行为的数据点在不同分组下具有一致的空间特征。“

研究人员利用聚类方法的“整体” - 用于识别数据集中类似对象组的技术 - 具有不同的参数。在每个训练运行中将每个数据点分配给一个集群,从该集群产生数学表示(矢量),构成数据点的“指纹”,该指纹可以组合成它的唯一签名表示。

为了生成表示“良好行为”(即一致性)的签名,团队将每个数据点向量组合在一起,并根据相应群集的大小对其进行加权,得到0到1之间的单个分数。低一致性 - a得分接近0 - 自然对应于异常行为。

他们写道,这种方法比传统的AI欺诈检测有几个优点。它不需要事先了解异常值或内点。并且基础算法(1)具有高度可扩展性和(2)通用性; 它几乎可以应用于任何群集问题,包括医学领域的问题。

该团队采购了数据科学平台Kaggle的公开信用卡数据库 - 其中包含了2013年9月欧洲持卡人在两天内(其中492个是欺诈性)进行的284,807份信用卡交易样本 - 以测试他们的方法。在总共10次运行之后,该算法能够以“高精度”识别40%的欺诈案例。

它并不完美 - 它标志着29项合法交易 - 但正如他们在报纸中指出的那样,考虑到成千上万的数据点,这是“一个巨大的收益”。

“我们的[技术]非常有用,因为在284,807个样本中,我们可以安全地排除139,220个[交易],”他们写道。

如果您最近在eBay上购买或出售过某些东西,您可能会遇到该系统的运行情况。研究人员腼腆地指出,它成功地从“电子商务平台”中挑选了数据中的欺诈交易:

“[我们]方法的动机来自于试图在电子商务平台上识别欺诈性消费者......每当电子商务公司引入新的消费者辅助功能或对某些交易行为施加限制时,它就为一些消费者滥用和打开了新的大门和途径。滥用平台。我们的算法在识别[欺诈]方面显示出巨大的潜力......但是,由于数据集的机密性,这些结果无法在本文中报告。“

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181108A112RV00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券