0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

首席科学家施亮主题为《深度画像的反欺诈应用》的精彩演讲

MqC7_CAAI_1981 来源:lq 2018-12-13 16:36 次阅读

由中国人工智能学会主办,广州易间网络科技有限公司承办的2018第八届中国智能产业高峰论坛11 月17-18日在成都完美收官,论坛在两天的会议里带来了多场精彩报告。

此次小编为大家整理的是来自北京顶象技术有限公司合伙人、首席科学家施亮主题为《深度画像的反欺诈应用》的精彩演讲。

施亮

北京顶象技术有限公司合伙人、首席科学家

以下内容根据速记进行整理

经过施亮本人校对

李康老师的演讲主要是针对人工智能使用框架本身的攻击,就是对人工智能自身的一个攻击。我在很多场合也听过李老师的演讲,但是今天听了之后心里还是有点发毛,其实我们是运用人工智能的技术来对抗黑产,如果碰到李老师这种针对AI工具自身的攻击,我觉得这样的攻击还是特别难防的。今天给大家带来的分享是想讲一下我们怎么使用人工智能技术去应对金融方面的欺诈场景。

首先介绍传统的用户画像技术,包括欺诈用户和正常用户的特征、画像的区别,以及如何通过机器学习的技术来分辨。传统的机器学习技术在这个领域应用也比较广泛,但是它存在一些缺点。第二个部分介绍关联网络图算法。第三部分是由于2017年到今年年初有一个深度学习运用于图算法的爆发期,所以给大家介绍一下深度学习图算法的技术,我们叫做深度画像。最后举几个实际工作中碰到的案例。

1. 传统的用户画像技术

传统的用户画像技术目前被广泛应用于金融领域。如图所示,左面主要是对用户的特征和属性的描述,例如收入、年龄、家庭的情况,这是简单的属性标签。右边是用户的行为,可以通过他的信用报告、贷款和还款的报告,以及转帐交易的行为,通过这些我们可以构造出用户的行为画像。

结合用户属性标签和行为画像,这就是传统画像主要基于的数据点,它是有些优势的。这种数据容易制定一些策略,从业务的角度理解出发,容易制定一些规则,也比较清晰。但是它有一个弱点,就是泛化能力比较弱。采用了一些机器学习的算法后,泛化能力得到了一定程度的加强。但是它没有考虑到用户之间的关系。传统的画像是在考虑用户单点的行为,在真正的行业中发现,用户之间会存在交互和关联关系。

2. 关联网络图算法

关联网络的传统算法分析用户之间的关联,比较早的尝试是对网络结构做一些分析,这种方法最早几十年前就有了,对图的分析,我给大家展示了两张图(见图1),最上面两张图中是对网络结构的展示,通过分析网络里是不是有特殊的结构等,这是比较早期的统计分析。在10年前此研究领域进入到半监督和无监督学习,当时这个研究方向是比较火爆的。中间两张图左图是半监督学习的一个例子。所谓半监督就是我们没有知道全部的样本,通过部分的样本学习出模型。这个图中开始只知道两个点,一个红色、一个蓝色,通过一些方法把信息根据图的结构向其他点进行传递,最后在这个图上可以对其他点也进行分类,这是一个半监督学习的典型例子。中间两张图右图是社区发现的一个例子,通过一些半监督学习最后可以做成这样一个个社区。

大约在5年前开始流行图嵌入学习的研究。图嵌入表示,一般流行的做法是把图中的点用向量进行表征,而且这个转换要符合和保留图的连接特征。在图上相临近的点,经过向量转化后,在向量的空间也是接近的,它们之间也有一定关系。经过向量的表征后可以做大量的算法,比如边的预测(link prediction),或者是分类、聚类的算法。在最下面这个图例中,我们用了一个图像的表征,是二维图像的表征,做了一个可视化的展示。可以看到图中接近的这些点,它们在二维空间中也是比较接近的。

图1

在机器学习算法进入深度学习的时代,用户有两个关切,一个是现在的关联网络也好,或者是关联网络支撑的反欺诈也好,是不是也能够沿用深度学习的技术,包括交互式、可视化的展示。前面李老师也讲了一些例子,我刚才讲传统画像技术里的特征是非常敏感的,如果想跨企业使用这些模型,会受到很大限制,因为你的模型特征是基于用户的很明显特征,比如收入状况、年龄状况等,对于企业之间的隔离,像做迁移学习都会受很大限制。基于这些限制,我们考虑引入深度学习技术。前面的例子是基于比较浅层神经网络的技术。图2列出的是目前比较流行的一些技术。现在的方法出得比较多,特别是像NIPS、AAAI上这类的文章比较多。最上面的图是根据它的拓扑关系和节点,用一个神经网络对每层进行表征,这是比较早的方法。中间的图,这个点其实是去看它的一度的邻居和两度的邻居,把一度的邻居和两度的邻居用深度学习核函数来表征,然后再做叠加。最下面这个图事一种叫GCN的算法,这是最近效果比较好的一个网络;也就是对每个点,通过一定方法,在每个点都用神经网络去模拟,然后在每层叠加形成一个深度网络。这个网络的好处就是它不仅对网络的连接关系进行embedding,也同时对节点的属性进行了embedding,这样出来的embedding结果会更加精确。

所有的建模都是要有数据支撑的,我们做这个项目也不能做无米之炊,首要的问题是构建一个靠谱的网络,图3是我们的一个辅助技术。比如这个网络是通过一个同设备,我们叫做同设备指纹来界定,黑产对抗时,会对手机的APP进行攻击,会模拟这个APP产生一些数据,那么我们采集的APP数据就不靠谱,这时采用什么样的机器学习方法都没有用。传统对APP的保护,可以说是加固或者是代码的混淆,比较容易破解,破解快可能就是1小时。我们做了一个虚拟源码保护的技术,在一个虚拟层做的技术,其被破解的难度比较大,可以做到一机一密,而且在非常短的时间内做到密钥更换。

图3

这个端数据保护技术是支撑上面这一块网络构建(见图3),我们想要的是真实手机数据,这方面我们也在跟国内顶尖的厂商进行合作。因为手机上的内容比大家想象的要多得多,除了屏幕分辨率、CPU型号、APP的版本、操作系统等之外,还有一些其他东西。现在手机基本有陀螺仪、GPS,可能还有一些海拔压力计等,这些信息采集后我们首先会做同人的检测,包括中间会有一些力度、仰角、左右手、操作间隔等,目的是什么?就是判断你的手机是不是被篡改了,或者是不是模拟设备而不是真人在使用。另外一个点就是来看设备和设备之间的关系,也许从表面上看这两个设备不一样,其实我们通过模型来分析有可能是同一个模拟器产生的;或者是有一个网络在中间,可以进行网络连接的。图3是我们用的一些具体技术。

3. 案例

首先是传统风控的场景,这个案例是一个比较传统的一家银行信用卡收单的场景(见图4),这边是信用卡交易的整个流程,一个复杂的系统一定容易受到攻击。这个交易过程是非常复杂的,一张信用卡收单过程涉及5个单位——持卡人、发卡行、收单行、商户和清算中心,任何一个环节通讯的不协调,或者中间的一个漏洞都会给黑产造成可乘之机。比如一张卡,由读卡器一刷,然后做一个伪卡,这是卡的风险。清算中心,这里也是有风险,比如内部的内盗,或者是清算上的数据泄露风险。在商户和收单行之间,黑产也会做一些攻击,中间黑客可能利用时间差搞一些花样,在这当中,包括持卡消费的过程有很多攻击点,我大概列了一下,包括伪卡欺诈等进行的违法犯罪。

图4

下面给大家介绍一个传统的风控方案。首先在这个端上要防止猫池。猫池是黑产模拟手机端的一个设备,其有一个很大的面板上插着成百上千的手机卡,黑产攻击时我们要采用端防护的方法,这里涉及到一个安全SDK的防护和设备指纹的采集。数据服务,信息核验,黑白名单,你的设备IP是不是在黑名单,然后传统的画像策略、风险的评分等。设备指纹黑名单,这是数据上的黑白名单,大家可以简单理解成名单的服务。下一步就是风控策略,主要是一些规则,比如是不是违反了反洗钱的策略,是通过传统的统计学习来作出策略,在当前绝大部分的银行还是一个非常主流的策略。另外,一些大行以及互联网的银行已经开始运用机器学习的方法,比如评分卡的模型、反欺诈的分类模型等,它会做传统的数据处理、特征工程,然后做分类、异常检测、进行评估监控这样整个的过程。

在上面案例中,我们最后是用了一个机器学习的模型——GBDT的模型,效果也不错。它和前面所有的这些,我们叫做全链路的风控。机器学习是不可以单独做风控,这个机器学习是依赖风控链路来做的模型。

这里列举了案例中的优点,可以做实时防护。如GBDT模型上线之后速度比较快;另外在每一个风险点上也可以做及时调整,模型重新的训练也是可以的,根据不同的突发风险来做调整。其缺点,没有考虑到样本之间的关系,忽视了挖掘团伙风险。从欺诈本质来说,欺诈行为很难从一个点完成,因为获利有限,所以基本都是团伙来完成,这个模型没有考虑团伙作案。

下面介绍运用关联网络技术的交易反欺诈和反洗钱,这也是我们在一家银行里做的,图5所示的几个网络中,红色的点是用户,是两个蓝色和黄色网络的主要节点,黄色的点是手机号的节点,绿色所示的是设备指纹网络,通过技术就可以对欺诈和洗钱的网络模式进行挖掘。

图5

图6(a)~(c)是根据传统的图算法挖掘出来的图结果。图(a)是一个疑似洗钱的网络,两个黑色的点表示他们之间有大量的交易,或者是有大量的转帐。这个行有几千万的交易,从这张图中能够看出来,挖掘出可疑的子网——一个洗钱的网络。图(b)同样也是,只是形式不一样。图(c)是根据手机网络挖掘出来的异常,中间是一个手机号;这几个是设备指纹,一个手机号应该是对应一个指纹,我们发现不同的设备指纹对应了同一个手机号,说明它是有问题的。图(d)是我们应用了深度学习技术,银行给到我们的样本,红色的是我们认为有问题的部分,绿色觉得应该是正常的样本。通过图(d)可以看出,中间这部分黑产或者是欺诈的团伙他们的聚集性是很强的,中间还有一些空泡,很异常的点;正常用户其实是不会和他们太近,所以形成了这些空泡。

图6

第二个案例(见图7),它对应的是用户IP和设备的图,正常应该是一条直线,这部分和直线有很大的偏离,通过检测之后发现基本都是异常用户。下面的两个图是我们在做验证码攻防时的图,左边是个热力图,显示某种行为的出现频次;右边图红色的是已知好的样本,蓝色是未知的样本。可以看出,好的样本在中心都是比较有聚集性的;蓝色的散落在周边的,经过验证,基本都是异常或者恶意的访问行为。

图7

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8408

    浏览量

    132573
  • 深度学习
    +关注

    关注

    73

    文章

    5500

    浏览量

    121117

原文标题:CIIS2018 演讲实录丨施亮:深度画像的反欺诈应用

文章出处:【微信号:CAAI-1981,微信公众号:中国人工智能学会】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    西湖大学:科学家+AI,科研新范式的样本

    研究,创新科研新范式。这一点在西湖大学的科研项目中已得到体现。 成立于2018年的西湖大学是由一公院士领衔创办的、聚焦前沿科学研究的研究型大学,该校鼓励科学家们探索AI与各学科交叉融合,为科研创新提速。为此,西湖大学在浪潮信息
    的头像 发表于 12-12 15:59 156次阅读
    西湖大学:<b class='flag-5'>科学家</b>+AI,科研新范式的样本

    蚂蚁集团收购边塞科技,吴翼出任强化学习实验室首席科学家

    学习领域的研究与发展。令人瞩目的是,边塞科技的创始人吴翼已正式加入该实验室,并担任首席科学家一职。 吴翼在其个人社交平台上对这一变动进行了回应。他表示,自己最近接受了蚂蚁集团的邀请,负责大模型强化学习领域的研究工
    的头像 发表于 11-22 11:14 568次阅读

    Volvo Group首席执行官将在CES 2025上发表主题演讲

    ® 2025的主题演讲嘉宾。 Volvo Group将重点介绍其实现100%安全、100%无化石燃料、100%更具生产力的交通运输和基础设施的愿景。
    的头像 发表于 11-17 10:05 204次阅读

    KiCon与全球开发者对话 主题演讲(日程概览)

    这次会议汇聚了 KiCad 全球的主要开发者,演讲主题也非常精彩!  
    的头像 发表于 11-13 12:04 157次阅读
    KiCon与全球开发者对话  <b class='flag-5'>主题</b><b class='flag-5'>演讲</b>(日程概览)

    王卫斌剖析中兴通讯在智能计算领域的战略愿景与核心布局

    在2024年世界人工智能大会(WAIC)的AI创新生态论坛上,中兴通讯产品规划领域的首席科学家王卫斌发表了题为《迈向AI新纪元:极智算网引领未来》的演讲,深刻剖析了中兴通讯在智能计算领
    的头像 发表于 07-09 16:24 679次阅读

    国科微AI首席科学家邢国良:打造全系边端AI芯片,赋能下一代自动驾驶

    7月4日,2024世界人工智能大会在上海开幕。香港中文大学教授、国科微AI首席科学家邢国良在智能汽车主题论坛发表《下一代自动驾驶技术:从嵌入式视觉到车路协同》演讲。他表示,智能网联为自
    的头像 发表于 07-09 11:35 523次阅读
    国科微AI<b class='flag-5'>首席</b><b class='flag-5'>科学家</b>邢国良:打造全系边端AI芯片,赋能下一代自动驾驶

    天津大学科学家突破人类大脑器官成功驱动机器人

    在科技探索的征途上,天津大学的科研团队再次迈出了令人瞩目的步伐。7月5日,该校宣布了一项革命性的成果——科学家们利用前沿的干细胞技术,成功培育出了高度模拟人类大脑的类脑器官,并创新性地将其与机器人系统通过先进的片上脑机接口技术紧密相连,开启了人脑与机器深度融合的新纪元。
    的头像 发表于 07-08 16:00 604次阅读

    新华社:突破性成果!祝贺我国科学家成功研发这一传感器!

    6月25日,新华社以《突破性成果!祝贺我国科学家》为标题,报道了由我国科学家研发的传感器成果。 我国科学家研发高通道神经探针实现猕猴全脑尺度神经活动监测 神经探针是一种用来记录神经活动的针状电传
    的头像 发表于 06-27 18:03 485次阅读
    新华社:突破性成果!祝贺我国<b class='flag-5'>科学家</b>成功研发这一传感器!

    前OpenAI首席科学家创办新的AI公司

    消息在业界引起了广泛关注,因为苏茨克维曾是OpenAI的联合创始人及首席科学家,并在去年在OpenAI董事会上扮演了重要角色。
    的头像 发表于 06-21 10:42 520次阅读

    NVIDIA CEO黄仁勋在 SIGGRAPH 2024 主题演讲中或将首次亮相消费级GPU Blackwell

    ABSTRACT摘要NVIDIA首席执行官黄仁勋将在2024年Siggraph上发表主题演讲主题为“面向新计算革命的图形”——消费级Blackwell即将到来?JAEALOT2024
    的头像 发表于 06-21 08:26 469次阅读
    NVIDIA CEO黄仁勋在 SIGGRAPH 2024 <b class='flag-5'>主题</b><b class='flag-5'>演讲</b>中或将首次亮相消费级GPU Blackwell

    红色警戒!深度伪造欺诈蔓延全球,ADVANCE.AI助力出海企业欺诈新升级

    近年来生成式人工智能技术迅猛发展,由此衍生的深度伪造 (Deepfake) 欺诈也愈发盛行,技术门槛的降低、生成效果的逼真、多样化的应用场景与检测难度的增加,让欺诈者们纷纷投向深度伪造
    的头像 发表于 06-12 15:57 474次阅读

    香港中文大学教授、IEEE Fellow邢国良出任国科微AI首席科学家

    4月22日,国科微宣布正式聘任国际顶级AI专家香港中文大学教授、IEEE  Fellow邢国良先生为国科微AI首席科学家,以进一步加强公司在AI边缘领域的技术探索,加快AI赛道商业部署。 邢国良教授
    的头像 发表于 04-22 15:49 507次阅读
    香港中文大学教授、IEEE Fellow邢国良出任国科微AI<b class='flag-5'>首席</b><b class='flag-5'>科学家</b>

    NVIDIA首席科学家Bill Dally:深度学习硬件趋势

    Bill Dally于2009年1月加入NVIDIA担任首席科学家,此前在斯坦福大学任职12年,担任计算机科学系主任。Dally及其斯坦福团队开发了系统架构、网络架构、信号传输、路由和同步技术,在今天的大多数大型并行计算机中都可
    的头像 发表于 02-25 16:16 1138次阅读
    NVIDIA<b class='flag-5'>首席</b><b class='flag-5'>科学家</b>Bill Dally:<b class='flag-5'>深度</b>学习硬件趋势

    谷歌DeepMind科学家欲建AI初创公司

    据知情人士透露,谷歌人工智能部门DeepMind的两名杰出科学家Laurent Sifre和Karl Tuyls正在与投资者商讨在巴黎成立一家新的人工智能初创公司的事宜。
    的头像 发表于 01-22 14:41 486次阅读

    飞腾首席科学家窦强荣获 “国家卓越工程师” 称号

         飞腾首席科学家窦强荣获 “国家卓越工程师” 称号 1月19日上午,首届 “国家工程师奖” 表彰大会在北京人民大会堂隆重举行。81 名个人被授予 “国家卓越工程师” 称号,50 个团队被授予
    的头像 发表于 01-19 19:22 1716次阅读
    飞腾<b class='flag-5'>首席</b><b class='flag-5'>科学家</b>窦强荣获 “国家卓越工程师” 称号