0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NN模型在金融风控场景中的应用

IEEE电气电子工程师 来源:未知 作者:庄福振 2022-07-08 15:30 次阅读

IEEE x ATEC

IEEE x ATEC科技思享会是由专业技术学会IEEE与前沿科技探索社区ATEC联合主办的技术沙龙。邀请行业专家学者分享前沿探索和技术实践,助力数字化发展。

在社会数字化进程中,随着网络化、智能化服务的不断深入,伴随服务衍生出的各类风险不容忽视。本期分享会的主题是《网络欺诈的风险与对抗》。五位嘉宾将从不同的技术领域和观察视角,围绕网络欺诈场景下的风险及对抗技术展开分享。

以下是庄福振研究员的演讲,《NN模型在金融风控场景中的应用》。

《NN模型在金融风控场景中的应用》

很高兴能来参加IEEE x ATEC科技思享会。我今天分享的题目是《NN模型在金融风控场景中的应用》。我今天的演讲内容主要分成三个部分:背景,研究工作,我们的一点总结。

众所周知,在过去十几年中,第三方在线支付市场发展迅速。同时,与在线交易相关的犯罪活动也大大增加,并且这种交易欺诈行为严重威胁了在线支付行业。2016年,互联网犯罪投诉中心就收到了近380万投诉,导致超过13亿的财务损失。在线交易欺诈中,最常见的是账户被盗以及卡被盗。账户被盗指的是未经授权的账户操作或欺诈者在控制了某人的付款账户后进行的交易,通常由于凭证泄露造成的。卡被盗表示某人卡的相关信息,例如卡号、账单信息等已被欺诈者获取并用于未经授权的一些收费。

下面我分享一下我们和蚂蚁集团联合做的一些研究工作。主要有三个工作,一个是基于神经层级分解机的用户事件序列分析(SIGIR 2020),第二个是基于双重重要性感知分解机的欺诈检测 (AAAI 2021),第三个是我们在可解释方面提出的利用层级可解释网络建模用户行为序列的跨领域欺诈检测 (WWW 2020)。

一、基于神经层级分解机的用户事件序列分析

首先是基于神经层级分解机的用户事件序列分析。在支付业务中,每个人都从注册系统、登录系统,再到把自己选择的商品放入购物车,最后做交易或者付款。根据用户的账户动态,我们可以判定下次付款到底是不是一个欺诈行为。用户的账户动态有丰富的数据序列信息可供利用。单纯只关注特征组合的工作或者单纯关注序列信息的工作,都只能从单独的角度去建模用户事件序列行为,每个事件仅通过简单的嵌入、拼接或者全连接,而难以获得更好的事件表示。我们希望设立一个层次化的模型同时结合这两方面进行建模,从而对欺诈检测进行分析。

2bf49f3c-fdd1-11ec-ba43-dac502259ad0.jpg

右图有两个案例,一个是我们在豆瓣上看了电影(如图1),同样也是一个用户行为序列,这里面最大的一个贡献是怎么去做这个事件的表示。我们刚才看到,每个事件实际上都包含了很多的特征。

2c0f16c8-fdd1-11ec-ba43-dac502259ad0.jpg

如图2所示,一个事件的特征包含X1到Xn这么多个特征。我们在用户的事件序列里,包括e1到eT的T个事件,每个事件在场景里面有56个特征,包括50个类别型特征和6个数字型特征。事件内部的特征之间的组合实际上更具判别性地来判定、预测欺诈检验。例如在1分钟之内进行的跨国交易,我们就很容易判断这是一笔盗卡行为。我们希望用FM模型去建模这种特征组合关系。FM是一种在嵌入空间中自动进行二阶特征组合的模型。看一下(图2)事件的表示:vi跟vj是两个特征的向量化的空间的表示,它是两两特征之间的一个组合,Xi跟Xj实际上是一个权重的表示。最后我们会得到一个事件的表示,从特征的交互得到一个特征的事件表示。

2c26cb7e-fdd1-11ec-ba43-dac502259ad0.jpg

当这个事件表示完后,我们希望得到一个比较好的序列表示,即我们对这个序列进行提取一个比较好的特征表示。每个用户序列实际上包含多个事件,两个事件组合发生,对欺诈行为检测更具有判别性。同样的,我们也希望去考虑事件之间的序列的影响。比如说我们先做A事件再做B事件,可能会导致欺诈的可能性变大。我们希望我们的模型能够去建模这种序列的影响。从刚才的角度出发,事件组合的建模,我们用S来表示,同样也是因子分解机去做的。不同事件两两组合,qi和qj也是它的一个权重。对于序列影响,我们从两方面去考虑,一是从事件自身的重要性去考虑,它有一个自注意力机制来表示就是Sself;还有一个是我们用RNN网络来去建模事件的历史序列行为信息,也就是双向的LSTM去建模。最后,我们可得出这个序列是由三部分组成:事件的组合;事件的自注意力机制;事件本身具有的一个特征。把三者组合在一起得到整体的序列表示。

2c53d1a0-fdd1-11ec-ba43-dac502259ad0.jpg

右边这张图是我们提出的一个框架,也叫做神经层级分解机。从底部开始,是有事件的特征。我们对哪个事件特征进行编码后,就可以去做这个事件的表示,学习做这个序列的提取。提取后,我们可以看到模型做一个多层感知机的输出。我们同样可以在这个Feature上面去做一个线性的分类。最终我们把这两部分当成一个Sigmoid的一个参数,得到0到1之间的输出,我们最终的一个优化函数其实是一个交叉熵的损失函数,N是对所有有标记的数据进行学习。这是我们的模型的一个框架。

2c6b37be-fdd1-11ec-ba43-dac502259ad0.jpg

在这个实验中,我们利用工业界里面的一个真实的数据集。例如LAZADA这样一个东南亚的电商平台,我们从这个平台上面拿到了三个国家的数据集。这个数据集正例是欺诈行为,负例是正常的交易行为,可以看到正常交易行为和异常的欺诈行为,相差非常大、类别非常不平衡。我们的公开数据集上、电影上的数据集也做了一个实验。在基准的算法比较上,我们采用了比较先进的一些算法,比如W&D(Wide & deep)宽度和深度,还有NFM、DeepFM、xDeepFM,以及M3利用混合模型同时学习序列的长短期依赖的模型。

2c7b4762-fdd1-11ec-ba43-dac502259ad0.jpg

我们的评价指标是采用真实工业场景里面比较关注的低用户打扰率时的召回率,即我们在给出结果时,我们希望对前面头部的百分之多少的用户打电话告诉他们这可能是一个欺诈行为。例如打1000个电话,这1000个应该都是有欺诈行为,即这个比例应该是越高越好的,因此我们采用的评价指标更关注于ROC曲线的头部(FPR<=1%) 。这里面有一个消融的

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3254

    浏览量

    48894
  • STM
    STM
    +关注

    关注

    1

    文章

    556

    浏览量

    42499

原文标题:【北航庄福振分享】NN模型在金融风控场景中的应用

文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    开源大模型多个业务场景的应用案例

    人工智能发展浪潮,大模型的开源与闭源之争一直是业内的热点话题。随着技术的不断进步和应用场景的日益丰富,如何降低大模型的使用门槛,让更多人
    的头像 发表于 12-30 10:16 113次阅读

    百川智能发布Baichuan4-Finance金融模型

    是百川智能通过行业首创的领域自约束训练方案精心打造而成的。该方案不仅注重提升模型金融能力,还兼顾了通用能力的提升,实现了两者之间的同步增强。这一特点使得Baichuan4-Finance
    的头像 发表于 12-25 10:11 189次阅读

    浪潮信息:元脑企智EPAI助力金融模型快速落地

    近日,2024金融科技应用创新发展大会暨农村金融机构信息化发展创新座谈会在上海举办。浪潮信息推出元脑企智EPAI企业大模型开发平台,面向金融业务场景
    的头像 发表于 09-20 16:07 365次阅读
    浪潮信息:元脑企智EPAI助力<b class='flag-5'>金融</b>大<b class='flag-5'>模型</b>快速落地

    探讨IP查询技术金融行业的深度应用

    随着互联网技术的飞速发展,金融行业对信息技术的依赖程度日益加深。其中,IP查询技术作为网络安全与控的重要工具,金融行业的应用日益广泛且
    的头像 发表于 09-07 10:08 268次阅读

    深度学习模型有哪些应用场景

    深度学习模型作为人工智能领域的重要分支,已经多个应用场景展现出其巨大的潜力和价值。这些应用不仅改变了我们的日常生活,还推动了科技进步和产业升级。以下将详细探讨深度学习
    的头像 发表于 07-16 18:25 2014次阅读

    AI模型MCU的应用

    机遇。将AI模型集成到MCU,不仅提升了设备的智能化水平,还使得设备能够执行更复杂的任务,实现自主决策和实时响应。本文将从AI模型MCU
    的头像 发表于 07-12 10:24 954次阅读

    华为如何助力金融模型开出价值之花

    2024,我们正见证金融模型走向成熟
    的头像 发表于 07-09 13:59 2599次阅读

    “技术故障”背刺巴菲特,金融模型到底靠不靠谱?

    英特尔® 至强® CPU Max系列处理器硬件能力、软件优化、生态适配、总拥有成本优势等方面都与金融场景非常契合,不失为业界大模型落地的一种新思路。
    的头像 发表于 06-28 23:05 214次阅读
    “技术故障”背刺巴菲特,<b class='flag-5'>金融</b>大<b class='flag-5'>模型</b>到底靠不靠谱?

    EVASH Ultra EEPROM 无线麦克方案的应用

    EVASH Ultra EEPROM 无线麦克方案的应用
    的头像 发表于 06-23 17:16 651次阅读

    金融模型,要听见远方的

    模型落地第一站,可以从远向近走
    的头像 发表于 05-11 09:50 1243次阅读
    <b class='flag-5'>金融</b>大<b class='flag-5'>模型</b>,要听见远方的<b class='flag-5'>风</b>

    【大语言模型:原理与工程实践】大语言模型的评测

    和优化至关重要,它们能够提供准确的反馈,指导模型训练和调优过程的改进方向。 大语言模型对话能力评测:对话能力评测是大语言模型性能评估的
    发表于 05-07 17:12

    商汤科技联合海通证券发布多模态全栈式大模型

    商汤科技近日隆重推出了其最新研发的“日日新SenseNova 5.0”大模型体系,并与海通证券携手,共同发布了业内首个专为金融行业量身打造的多模态全栈式大模型。此次强强联合旨在加速大模型
    的头像 发表于 05-07 14:15 480次阅读

    商汤科技与海通证券携手发布金融行业首个多模态全栈式大模型

    商汤科技与海通证券联合研发并发布了金融行业内首个面向多业务场景的多模态全栈式大模型。双方计划将这一先进技术应用于智能问答、合规控、代码辅助以及办公助手等关键业务领域,以实现大
    的头像 发表于 05-06 10:16 473次阅读

    模型战略评估系统的应用有哪些

    智慧华盛恒辉大模型,顾名思义,是指参数规模超过千万的机器学习模型。这些模型主要应用于自然语言处理、计算机视觉、语音识别等领域,场景下的表
    的头像 发表于 04-24 13:48 292次阅读

    华为云盘古大模型通过金融模型标准符合性验证

    近日,中国信通院组织的可信AI大模型标准符合性验证,华为云的盘古大模型表现出色,成功通过了金融模型
    的头像 发表于 03-05 10:12 652次阅读