首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

什么是关联图谱?——关联图谱(一)

异常检测、设备指纹和关联图谱是人工智能反欺诈实践中重要的机器学习反欺诈技术,这些技术在应对自动化和身份欺诈等场景中非常有效。在反欺诈的实战中,欺诈者经常呈现出团伙作案的特征。对于团伙欺诈,关联图谱是非常有效的手段,本文将重点介绍关联图谱的定义。

什么是关联图谱?

在一般的机器学习的场景中,我们往往考察的是单一信息点的属性。在反欺诈的场景中,还有另一类非常有效的信息,关联信息。比如某用户A的住址为X,某用户B的住址也是X,用户A和用户B则通过地址X相互关联。和一般数值型的信息不同,这种关联表达的是一种结构型的信息。我们把这种关联关系用图表达出来,就构成了一张关联图谱,有时也称为社交网络。在反欺诈场景中,团伙欺诈用常规的方法比较难发现,关联图谱或者说社交网络分析是发现欺诈团伙的重要方法。

社交网络方法的理论基础是图论。图论作为一门新兴学科,本身有很多分支,如几何图论,组合图论,算法图论,随机图论,代数图论等。计算机专业的图论入门往往是从组合图论开始的,而在人工智能的领域里代数图论也有很重要的应用。

一个社交网络或者说图是由节点和边组成。在数学上用矩阵来表示节点间的邻接关系,我们称之为邻接矩阵。这样就把一个组合数学问题转化成了一个矩阵或者说线性代数的问题。

图一

根据图的边是否具有方向性,社交网络可分为有向图和无向图。图一是一个无向图的例子,图二是一个有向图。

图二

根据边的性质是否相同又可以分为同构网络和异构网络。相同类的边和节点组成的网络称为同构网络,不同类的边和节点组成的网络称为异构网络。

描述社交网络的指标有很多,这边简单的介绍几类:关联度,中心度和网络聚类。

第一类是关联度指标。一度的关联度即是指一个节点和多少个其他节点相邻。如果是有向网络,还可细分为入度和出度,分别对应链入和链出的节点数。二度关联度则是指介由一个中间节点相关联的节点数。一度,二度关联的关联度在反欺诈的场景中的使用非常的广泛。

另一类标志节点重要性的指标是中心度(Centrality,有时也译作中心性):比如介数中心度,特征向量中心度等等。介数中心度度量对于一个节点X,多少其他节点对之间的最短路径必须介由X。特征向量中心度则可以认为是一度关联度的一种延伸,当考虑一个节点的重要性时,不止考虑他有多少个邻接节点,还要考虑这些邻接节点的重要性。大名鼎鼎的PageRank实际上是特征向量中心度的一个变种。

第三类指标是在网络上的聚类。物以类聚,人以群分,考察和一个节点有紧密联系的其他节点所构成聚类的共性,往往对研究该节点的特性有很强的指导性。

由于文章篇幅有限,我们将在下一期文章中向大家介绍关联图谱分析的常用方法,敬请期待~

本文作者:周辉 Maxent猛犸反欺诈联合创始人

----持续更新 ----

未经授权,严禁转载

欢迎关注

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180607G0QD0300?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券