干货!浅谈知识图谱的构建与应用

自从2012年Geogle推出自己第一版知识图谱以来,各大互联网企业也纷纷推出了自己的知识图谱产品。知识图谱是把所有不同种类的信息连接在一起而得到的一个关系网络,它提供了从“关系”的角度去分析问题的能力,是关系最有效的表达方式,目前在营销、交通、风控场景,知识图谱均有应用。今天,我们从反欺诈的角度浅谈知识图谱的构建与应用。在互联网金融行业,不少的欺诈案件会涉及到复杂的关系网络,而知识图谱可以帮助我们更有效的分析复杂关系中存在的特定的潜在风险,可以提高贷前信审和贷后监控的效率,对于金融风险的控制也有着极大的裨益。

知识图谱的整体构建

我们通过将借款人的关键信息数据整合到知识图谱中,逐步挖掘与这些信息有关联的其他个人,形成关系网络,从而进行分析和诊断。知识图谱作为一种基于图的数据结构,它由节点(实体)和边(关系)组成,每个节点代表一个个体,每条边为个体与个体之间的关系,把与借款人有关的所有数据都打通,构建包含多数据源的知识图谱。在构建过程中,我们需要通过节点定义,边关系处理以及规则集搭建来实现图谱的展示。

第一,定义业务节点。节点即为实体数据,如客户的ID,身份证,手机号,设备,微信,微博,邮箱,QQ等等,一般用户ID我们认为是业务的核心顶点。可以利用任意节点拓展用户所有信息。同时可以建立双节点关联,实现节点之间的关系查询。

第二,边关系的处理。边关系是用来描述两节点间边的属性内容。例如在使用设备信息时,用户可能有登录、注册、转账等不同的行为属性,手机也有呼入呼出等不同的行为属性,在处理边关系时,我们加入属性描述和构建能更加有效的识别用户的行为轨迹和关联关系。

第三,规则集搭建。有了节点和关系,我们已经构建了基础的关系网络,但这样的网络并不能直接将反欺诈所需要的核心业务信息展示使用,这时规则集的搭建就显的格外重要。例如我们使用手机号聚集关联,IP聚集关联,公司聚集关联,设备聚集关联,通讯录重合度聚集关联等等,将节点与节点之间的关联关系聚集,形成聚集关联,直接用于查询,快速定位案件性质。

完成如上数据整理工作后,结合neo4j的图形数据库,我们来看看最终的图展示效果:

如上图,我们发现该A客户手机通讯录中将好几个手机号备注为XX客户,而XX客户同样为申贷用户且存在共性问题(如申贷时间差不多,使用设备重合,逾期…),且他们的通讯录中将该A客户备注为贷款中介,由此可定位A客户很可能是中介,再结合其他可疑点定性中介欺诈,进而挖掘团伙。

我们利用图谱的数据结构,构建反欺诈知识图谱有效抵御个人信息造假,组团欺诈的风险。当然知识图谱不仅在反欺诈调研中能帮助更好更快速的案件定性,在逾期催收中也起着重要的作用,比如很多逾期客户失联,通过知识图谱的关联可以帮助我们挖掘出更多潜在的新的联系人,从而提高催收成功率。篇幅原因,文中的一些技术细节不做更多讨论。

知识图谱的广泛应用

毫无疑问,知识图谱的图展示应用能非常有效快速定位用户的关联关系和识别团伙案件,除了基础应用之外,我们可以继续加入模糊匹配和消除歧义等技术应用来进一步完善图谱的应用。同时基于图算法我们还能进一步挖掘其中价值,例如通过不同人之间的紧密程度计算来分析用户的风险等级并融入模型应用。同样也正是基于图计算的逻辑能完成用户关系、偏好、行为轨迹等一系列的识别,在大数据时代,在合理采取用户数据的前提下,相信图谱会更加多的运用在医疗、保险、营销等方方面面。

END.

来源: 51AntiFraud

原文发布于微信公众号 - PPV课数据科学社区(ppvke123)

原文发表时间:2017-06-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏企鹅号快讯

如何开发一款游戏:游戏开发流程及所需工具

「文末高能」 编辑 | 哈比 游戏作为娱乐生活的一个方面,参与其中的人越来越多,而大部分参与其中的人都是以玩家的身份。 他们热爱一款游戏,或是被游戏的故事情节、...

48210
来自专栏熊二哥

架构设计深入学习01--概论与预架构阶段

完成一个比较复杂的项目后,终于有空看看书了,这次决定将架构设计的方法论进行一次系统的学习,借助温昱大师的《一线架构师》一书。我将把这次学习分成三部分,分别是概论...

2195
来自专栏镁客网

华为公布手势动作输入方法新专利,让手背充当“触控屏” | 热点

1373
来自专栏企鹅号快讯

语音识别类产品的分类及应用场景

前言:本文作者@焦糖玛奇朵,是我们“AI产品经理大本营”早期成员,下面是她分享的第1篇文章,欢迎更多有兴趣“主动输出”的朋友们一起加入、共同进步:) ? 音频由...

38311
来自专栏互联网杂技

20个有用的UX日常使用工具&APPs

交互设计师或产品经理在工作中需要一些用户研究的工具,此文分享了一些日常使用的app及在线工具,希望对大家有所帮助~~ 在UX团队工作通常需要掌握相当多的在线工具...

3578
来自专栏腾讯大讲堂的专栏

腾讯自动化测试的AI智能

引子: 本文是林奕在腾讯 DevDays 2018 分享内容的脱敏整理,介绍了 CSIG 测试开发中心(前 SNG 测试开发中心)在自动化测试领域所做的智能...

8332
来自专栏机器之心

入门 | 如果是个穷光蛋:如何从零开始学习成为一个数据科学家?

去年,我自学了数据科学,搜集了几百个在线资源,每天学 6~8 个小时。与此同时,我白天还在日托中心上班,拿着最低的薪资水平。

962
来自专栏CSDN技术头条

如何成为一名数据科学家

本文是出自Springboard上面一篇文章的摘录,介绍了如果想成为一名数据科学家,需要掌握哪些技能,熟练使用哪些工具,以及如何对数据进行处理等。 ? 数据科学...

21510
来自专栏腾讯云TStack专栏

腾讯云TStack监控云平台通过国家标准云测评

4884
来自专栏云计算D1net

如何管理云计算成本

如今,组织经常选择使用公共云服务,其部分原因是希望节省资金。但是,如果组织没有实施正确的治理和成本优化措施,通常会发现他们的云计算成本正在失控,将会大幅增长。 ...

5324

扫码关注云+社区