如今互联网黑产已经发展了何种惊心动魄的地步?
从贷款前的反欺诈,再到实际支付,人工智能到底怎么与黑产做斗争?
分享嘉宾:顾威同盾科技副总裁
整理编辑:AI100
在具体深入人工智能到底如何与互联网做斗争之前,我们先来看看互联网黑产,到底已经发展到怎样的程度。
互联网黑产远超你的想象
互联网黑产远超你的想象
首先,我们说互联网黑产的发展趋势。
互联网的欺诈现在攻击呈多元化的方式。手机应用也好,网页端也好,都有很多欺诈分子,去做虚假的流量,虚假的安装量,然后虚假注册、虚假登陆,人为制造很多客户给你。
再看交易支付。
刷单、薅羊毛,很多案例因为营销活动,损失了很多真金白银,实际上并没有吸引到很多真实用户。
另外,还有内容上的攻击和欺诈。
这就包括现在直播平台的很多言论,涉广告、涉黄、涉赌、涉政的言论。
这是黑产的类型,相应的,其互联网黑产的作弊工具,目前也已进入到产业化、科技化阶段。
可能大多数都没有意识到,如今的黑产到底进化到怎样的先进程度。
其实,从一开始的卡商,到SIM卡,再到整个的所谓的猫池,有专门的工具,把几百张SIM卡放到池子里面,做相应的登陆、抢红包的行为。
包括开发人员,包括下游的黑产相关人员,整个是一个产业链条。
有些时候,机器并不能完成所有,也就有专门的人来做这一块。
举个例子——验证码。黑产中,有一环节,就是有专职人员来手动敲这个码,并且以产业化的方式,高效完成这个事情。
还有的黑产,是通过采取各种方式攻破你的应用,通过网上公开的泄露信息,去撞库。因为大多数人用的同样的用户名和密码,这时,黑产攻破后,用理财端就可以买相关的理财产品,或者赎回。因为钱大多数都是同卡进出,钱并没有转走,但是黑产给你发短信,告诉你资金有风险,告诉你如何保护,如何把钱转到某地等。这也是典型的欺诈方法。
面对黑产,这是一个攻防战。
作为安全方,我们会从各种迹象中捕捉到猫腻。
一个手机号码,或者一个SIM卡,可能有一个全网流窜化的过程。
如果同一个设备、同一个手机号,注册了成百上千的账户,去抢某金融营销的红包,它肯定是作弊行为。
再举一个例子,短信的端口,手机应用都有一个短信验证码,你注册的时候一点发一个验证码,这个端口都有很多人作弊。前几年比较著名的马荣事件,她新男朋友的手机号当时被很多人填上去,发很多验证码,我们后台监控的同事看到了,那天针对那个手机号的攻击达到了几万人级别的量级。
防范风险的三个维度
这样的风险,提前应该怎么防范呢?
有一个很重要的维度,设备画像。
通过设备的ID,提前甄别出,信息来源是不是同一个手机,或者压根不是手机,只是一个模拟器。
另外,很多时候,手机可能有多个,但PC端设备只有一个。
比如,用不同的手机盗刷的卡,全部来自同一个PC端,那也是有问题的。
我们有将近30亿的量级的设备维度信息。通过设备画像,将信息放到所谓的反欺诈规则里去。
还有一个很重要的维度,IP画像。
IP地址,我们有一个全维度的画像,IP是不是用了代理,它的真实住址是什么,是住宅类,还是院校,还是大型机房或者数据中心?
如果我们收到很多贷款的请求,都是从一个数据中心地后台来的,就可能判断它可能不是真正的人在操作,可能是机器人在做这件事情。
除此,针对信贷,也要有专门的一些纬度去甄别。
而这里,最关键的,也就是所掌握的反欺诈的相关数据。比如,高风险的关注名单,俗称黑灰名单;
不同行业、机构的在信贷上的逾期还款行为;
比如同样的申请人以同样的手机号或不同的手机号,用同样的设备在某一个行业申请贷款的次数,及相关的表现行为;
账号的社交数据,与身份有关的数据及相关的第三方数据。
人工智能到底能帮上什么忙?
谈到人工智能,最核心、最典型的应用,就是深度学习的模型了。结合我们现有的海量数据,通过深度学习的模式,我们做了一个反欺诈的模型。
这个模型很简单,使用起来也比较方便。
主要通过一个分数衡量欺诈的嫌疑概率。
分数越高,欺诈风险可能性越高。如果在风控时,将分数最高的前10%的人拒掉,就能躲过80%的欺诈事件。如果将分数最高的前20%的人拒掉,就把90%的欺诈事件扼杀住。当然,这个模型,也可以根据风险偏好,对欺诈的容忍程度,灵活的使用这个欺诈分。
最后,我们有一个技术叫做复杂网络。我们可以利用复杂网络的技术,通过不同的维度,包括手机号、设备、身份证号,或者邮箱,类似这样的信息关联起来,抓到相关的黑产团伙。对于这些团伙,我们也可以在贷前申请的实时阶段进行侦测,比如把规则配到规则引擎里面去,看申请实时端是否有已知团伙,然后结合欺诈分作出全面有效的评估。
➤版权申明:该文章版权归AI100所有,如需转载、摘编、复制等,请后台留言征得同意。若有直接抄袭,AI100将追究其责任。