0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GNN在反欺诈领域的落地应用

芯盾时代 来源:芯盾时代 作者:芯盾时代 2020-09-24 15:12 次阅读

GCN基础知识 ·

其实有关GCN的相关基础知识在网上都查的到,后面涉及到的数学知识还是十分复杂的,这里就不详细推导每一个步骤。这里就直接给出一个最终的结论,也是Kipf and Welling在2016年 GCN领域最经典的paper《Semi-supervised classification with graph convolutional networks.》里对原始的基于拉普拉斯谱变换进行了一些简化得到最终的图卷积公式:

,其中是一个对称归一化矩阵, ,,其中是单位矩阵,是临接矩阵,是矩阵 的对角度矩阵,是第t层的中间隐层表示。即初始的输入是每一个node节点的embedding表示,这样最后GCN输出的最后一层节点的Embedding包不但包含了节点的初始特征还包含了网络的拓扑特征。从GCN最基本的变换公式可以看出,我们需要做的是结合业务场景定义的是临接矩阵和节点的初始状态。

上面其实是最基本的GCN的函数形式,以后所有的GCN变体都是在这个基础之上进行衍生,比方说当的时候,就是另一种形式的GCN。

下面从2篇paper出发,讲解一下GNN在反欺诈领域的落地应用。

一、《Heterogeneous Graph Neural Networks for Malicious Account Detection》

即在异构网络中使用Graph Neural network去进行欺诈。根据分析出的欺诈账户规律,总结出黑产用户活动的2个规律:

Device aggregation:设备聚集性,即黑产手中的设备资源是有限的,这里的设备是一个抽象的概念,具体化可以有IP、设备ID、账户等信息

Activity aggregation:活动方式的聚集性,即由于黑产设备是在同一批的控制之下活动的,那么这些账户之间一定存在着较大的共线性。

理解这两个黑产活动规律是很重要的,后面的模型都是针对这两个规律进行构建。

正如paper标题中所说的,论文提出的是一个异构网络,即网络中的节点包括了2类:Account(账户) 和 Device(设备资源)。如果网络中某一个节点account i在设备节点device j上有登录或者注册等行为(这里的account可以认为是主维度字段,device可以认为是关联维度字段),那么节点i和j之间就有一条边(个人认为这样的定义有点太宽松了,应该加上时间窗口),这样N个account和device的节点就可以形成一个网络,其临接矩阵的表征形式为。由于这里面的设备是一个抽象的概念,如果具体的话可以有IP、设备ID、阿里设备指纹等形式(假设具体的设备字段个数为D),所有针对某一类具体的设备字段会有一个sub-graph即,而的邻居矩阵维度即顶点数和一样,只不过只留下了和当前type d有关系的边。

接下来我们要定义节点的初始状态矩阵,这里可以发现矩阵的行数是节点的数量N,而列数是。其中是当节点为account时,将数据按照时间划分出个time slot(在实际工程中,可以加入其它和节点相关的特征进去),并统计每一个time slot中的操作次数;而则是当节点为device不同关联维度的种类数即type d的数量,这里采用的是one-hot编码的方式。由于是异构网络,即一个矩阵中存在含义不同的节点,但是为了保证每一个节点的维度都一致,多余的维度即针对account 节点来说就多余了为,对于device 节点来说就多余了维,都采用填充0的方式进行对齐。

下面就是图神经网络的递推迭代公式:

其中属于图神经网络的中间层输出,和属于模型参数,随着模型一起学习。最后的损失函数,即当T层之后,可以使用少部分标注数据进行网络参数的学习,最终的损失函数是交叉熵形式为:

这里作者发现,在公式一中,可以使用attention机制来优化效果,即优化升级公式二引入attention机制,得到

其中,,其中。

二、《GeniePath: Graph Neural Networks with Adaptive Receptive Paths》

从题目中可以看到“Adaptive Receptive Paths”,即自适应的最佳搜索路径。

这也是本篇paper最大的创新点和贡献点,创新点是相对于基础的GCN来讲的,从上面可知基础的GCN迭代公式形式为:,如果神经网络的层数为T,那么T层的节点输出就是考虑了距离当前节点t距离为T的所有邻居,为了增加考虑的邻居数,可以不断的增加T,但是过多的层数会导致模型参数量过大,导致模型在训练的时候难以收敛,故有些paper会结合残差网络的概念引入残差网络,即

但是这样依然是会有2个比较显著的缺陷:

并不是所有邻居都是同等重要的(对应paper里的breadth 方向的Adaptive Receptive Paths);

并不是所有深度搜索的路径都是一样重要的(对应paper里的depth方向的Adaptive Receptive Paths)。

上图形象的说明了adaptive receptive path的概念,即目标target节点周围的邻居以及对应更远的hop的路径重要程度是不一样的,图中有浅蓝色底色的区域就是adaptive receptive path。哪些邻居节点和更远的延伸路径是adaptive receptive path,这就是本篇paper要解决的问题。

基于此,paper提出了基于breadth 和depth两个方向自适应优化的算法框架:

//这里需要注意的是, breadth function需要具备permutation invariant的性质,即无论邻居节点输入的顺序如何, breadth function生成的结果都是一样的

具体来说:breadth function 形式:,其中

depth function 形式(很大程度上借鉴了LSTM的信息流控制形式):

对于每一个节点i来讲,这两个步骤的具体表现如下图所示:

图中操作代表了

另一种综合考虑breadth function和depth function的变体Variant形式

即将depth function的操作推迟,首先仅仅按照breadth function操作对原始输入数据进行T层转换,得到每一层的输出结果向量,接下来将序列输入到下述变换公式中:

其中

这两年GNN以及GCN的概念还是非常火的,个人经验是,我们在运用的时候,网络层间的迭代公式使用目前常用的几种就可以,作为算法工程师的我们唯一需要注意的地方就是:

定义好临接矩阵AA的形式;

定义好节点特征状态XX的初始形式。

接下来就可以使用GCN来直接进行节点的分类,或者提取节点的全面特征,供后续的分类所用。

作者有话说·

本文主要参考了阿里蚂蚁金服团队的《Heterogeneous Graph Neural Networks for Malicious Account Detection》和《GeniePath: Graph Neural Networks with Adaptive Receptive Paths》,两篇论文均使用了当下最流行的Graph Neural Network 相关知识。

随着GNN技术应用于反欺诈领域,GNN以及相关变种模型以强大的网络拓扑表征能力,挖掘出具有欺诈社区属性的黑产团伙,也使得反欺诈挖掘算法迈上了一个新的台阶。

原文标题:“芯”分享 | GNN在反欺诈领域的落地应用

文章出处:【微信公众号:芯盾时代】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 网络安全
    +关注

    关注

    10

    文章

    3102

    浏览量

    59518

原文标题:“芯”分享 | GNN在反欺诈领域的落地应用

文章出处:【微信号:trusfort,微信公众号:芯盾时代】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Flyback激变换器的定义和工作原理

    为磁能并储存在变压器中,然后开关管关断时将磁能转化为电能传输给负载。Flyback激变换器输入级和输出级之间提供绝缘隔离,是开关电源领域中的一种重要拓扑结构。
    的头像 发表于 09-12 11:30 756次阅读

    零信任业务安全产品方案提供商芯盾时代再度中标乌鲁木齐银行实时监测全系统

    交易的防控能力,提升银行的品牌影响力。 项目背景 随着银行业务的不断发展,交易场景的不断丰富,在为客户提供快捷便利办理业务的服务的同时,各类欺诈交易的发生的可能性也不断提高。 建立覆盖全渠道交易场景的实时
    的头像 发表于 08-19 18:59 562次阅读

    高效能激变换器解决方案

    随着电子系统应用领域的不断扩展,低功耗设计需求激增。为满足可靠和高效的电力转换各种电子系统中的需求日益增长,尤其是实现低功耗规格的不断扩展的应用领域。Bourns 拥有广泛的磁性元件定制能力,其中
    的头像 发表于 07-23 11:11 274次阅读
    高效能<b class='flag-5'>反</b>激变换器解决方案

    如何在Tensorflow中实现卷积

    TensorFlow中实现卷积(也称为转置卷积或分数步长卷积)是一个涉及多个概念和步骤的过程。卷积在深度学习领域,特别是图像分割、图
    的头像 发表于 07-14 10:46 517次阅读

    深度学习中卷积的原理和应用

    深度学习的广阔领域中,卷积(Deconvolution,也称作Transposed Convolution)作为一种重要的图像上采样技术,扮演着至关重要的角色。特别是计算机视觉任
    的头像 发表于 07-14 10:22 1217次阅读

    红色警戒!深度伪造欺诈蔓延全球,ADVANCE.AI助力出海企业欺诈新升级

    欺诈泛滥已经给全球范围内各行业市场带来严重挑战。 根据相关数据统计显示,深度伪造欺诈攻击2023年增加了3000%,全球深度伪造欺诈事件在过去几年呈现激增之势,尤其是
    的头像 发表于 06-12 15:57 416次阅读

    标贝数据采集标注自动驾驶场景中落地应用实例

    AI数据服务作为人工智能和机器学习的基础,自动驾驶领域中有着重要地位。与其他人工智能应用场景相比,自动驾驶的落地场景相对复杂,想要让汽车本身的算法做到处理更多、更复杂的场景,就需要运用大量场景化
    的头像 发表于 05-28 14:22 434次阅读
    标贝数据采集标注<b class='flag-5'>在</b>自动驾驶场景中<b class='flag-5'>落地</b>应用实例

    芯盾时代中标山西银行!欺诈中心精准防控高风险事件

    芯盾时代中标山西银行!芯盾时代基于自身丰富的欺诈建设经验,通过自主研发的智能决策平台,建立基于账户全生命周期管理的“事前预警、事中控制、事后监测”的全方位动态风险监测系统,
    的头像 发表于 04-23 14:28 809次阅读
    芯盾时代中标山西银行!<b class='flag-5'>反</b><b class='flag-5'>欺诈</b>中心精准防控高风险事件

    芯盾时代用实力赢得汉口银行的认可 极大助力客户信息化建设

    芯盾时代中标汉口银行交易欺诈项目并如期上线,实现交易欺诈风险的自动化实时甄别、预警和处置,为行方提供场景化的全流程业务安全防护。
    的头像 发表于 04-02 11:39 441次阅读

    NVIDIA加速识因智能AI大模型落地应用方面的重要作用介绍

    本案例介绍了 NVIDIA 加速识因智能 AI 大模型落地应用方面的重要作用。生成式大模型已广泛应用于各领域,通过学习人类思维方式,能快速挖掘海量内容,满足不同需求。
    的头像 发表于 03-29 15:28 558次阅读

    证监会:未有IPO倒查10年安排,严审重罚财务造假、欺诈发行

    在上市许可审查工作方面,监管部门正,E前全流程监管,严惩财务欺诈及首发业务欺诈,同时增加了对拟上市企业的现场检查比率。以此推动上市公司整体质量的提升,回应当前市场对投资者权益保护的关注。
    的头像 发表于 02-25 09:21 436次阅读

    落地式转轴扭力试验机:测量工业领域的关键

    落地式转轴扭力试验机:测量工业领域的关键?|深圳磐石测控仪器
    的头像 发表于 02-22 09:10 393次阅读
    <b class='flag-5'>落地</b>式转轴扭力试验机:测量工业<b class='flag-5'>领域</b>的关键

    万事达卡推出欺诈检测AI大模型

    全球领先的支付技术公司万事达卡(MasterCard)近日宣布推出其自研的生成式AI大模型“Decision Intelligence Pro”(决策智能专业版),以更快速、准确地检测和防止欺诈交易。
    的头像 发表于 02-05 10:34 935次阅读

    激有源钳位原理分析

    激有源钳位电路是一种电力电子领域中广泛应用的电路结构,主要用于实现电压的转换与控制。该电路通过激效应和有源钳位技术,实现对输入电压的调整和输出电压的稳定。本文将详细分析
    的头像 发表于 12-13 10:49 3214次阅读

    人寿保险成功应用声扬科技VoiceDNA欺诈平台:减损百万,投诉量降六成

    近日,声扬科技收到某寿险客户的反馈与致谢,该人寿保险公司应用声扬科技VoiceDNA语音欺诈平台15个月以来,共计识别到500余次声纹不一致的情况,通过进一步核实发现了超过170名风险客户,由此
    的头像 发表于 12-04 17:00 791次阅读
    人寿保险成功应用声扬科技VoiceDNA<b class='flag-5'>反</b><b class='flag-5'>欺诈</b>平台:减损百万,投诉量降六成