0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里妈妈技术团队对Euler的详细解读

jmiy_worldofai 来源:cc 2019-01-22 14:02 次阅读

AI 科技评论消息,继去年 11 月开源面向高维稀疏数据场景的深度优化工具X-Deep Learning(截至发稿,GitHub Star 数已达到 1972)之后,阿里妈妈团队于今日正式开源大规模分布式图表征学习框架 Euler,这一框架具有四大特点:

大规模图的分布式学习

支持图分割和高效稳定的分布式训练,可以轻松支撑数十亿点、数百亿边的计算规模。

支持复杂异构图的表征

在图结构存储和图计算的抽象上均良好的支持异构点、异构边类型的操作,并支持丰富的异构属性,可以很容易的在图学习算法中进行异构图的表征学习。

图学习与深度学习的结合

支持基于深度学习样本的 mini-batch 训练,把图表征直接输入到深度学习网络中联合训练。

分层抽象与灵活扩展

Euler 系统抽象为图引擎层、图操作算子层、算法实现层三个层次,可以快速的在高层扩展一个图学习算法,同时,Euler 内置了大量算法实现可供直接使用。

阿里妈妈团队表示,近年来随着在图深度学习技术的突破,有希望通过图引入知识结构和推理能力,与深度学习的结合,进一步提升模型能力。

2017 年 3 月,阿里妈妈团队在探索使用深度学习来刻画用户与广告的连接关系时,他们意识到图深度学习是一个非常重要的技术方向,且业界没有成熟的解决方案。2017 年 5 月,阿里妈妈开发完成第一个单机版本的图学习系统,支持他们基于随机游走类的图学习算法,并在阿里妈妈深度匹配业务上取得不错的效果。2018 年初,Euler 支持大规模分布式图学习能力,支持在数十亿点、数百亿边的大规模图上进行业务迭代。2018 年中,Euler 全面支持 GCN 类算法,并且创新的提出 LasGNN 模型与 Scalable-GCN 训练加速算法。2018 年 9 月,阿里妈妈正式决定把 Euler 的能力与业界分享,启动 Euler 的开源准备。而今天,在做了详尽准备之后,这一工具正式与所有开发者见面。

阿里妈妈团队也详述了 Euler 系统设计:

Euler 系统架构图

Euler 系统整体可以分为三层:最底层的分布式图引擎,中间层图语义的算子,高层的图表示学习算法。

各个层次的核心功能如下:

一、分布式图引擎

分布式图引擎针对海量图存储,分布式并行图计算及异构图进行了优化设计,确保了工业场景下的有效应用。

首先为了存储超大规模图(数十亿点,数百亿边),Euler 必须突破单机的限制,从而采用了分布式的存储架构。在图加载时,整张图在引擎内部被切分为多个子图,每个计算节点被分配 1 个或几个子图进行加载。

为了充分利用各个计算节点的能力,在进行图的操作时,顶层操作被分解为多个对子图的操作由各个节点并行执行。这样随着更多节点的加入,可以得到更好的服务能力。然后,引入多 replica 的支持,用户从而可以灵活平衡 shard 与 replica 的数量,取得更佳的服务能力。最后,针对图表示学习优化了底层的图存储数据结构与操作算法,单机的图操作性能获得了数倍的提升。

多种不同类型的边,点与属性所组成的异构图,对很多复杂的业务场景必不可少。为了支持异构图计算能力,底层存储按照不同的节点与边的类型分别组织。这样可以高效支持异构的图操作。

二、中间图操作算子

由于图学习算法的多样性以及业务的复杂性,固定的某几种甚至几十种算法实现无法满足客户的所有需求。所以在 Euler 设计中,阿里妈妈围绕底层系统的核心能力着重设计了灵活强大的图操作算子,且所有算子均支持异构图操作语义。用户可以利用它来快速搭建自己的算法变体,满足独特的业务需求。

首先,Euler 分布式图引擎提供了 C++ 的 API 来提供所有图操作。基于这个 API,大家可以方便的基于某个深度学习框架添加图操作的算子,从而利用 Euler C++ 接口访问底层图引擎的能力。支持广泛使用的深度学习框架,比如阿里巴巴的 X-DeepLearning 与流行的 TensorFlow。后继会考虑支持其它的深度学习框架,比如 PyTorch。

利用灵活的图操作算子,机器学习框架可以在每个 mini-batch 与 Euler 交互,动态扩充与组织训练样本。这样,Euler 不仅支持传统的以图为中心的学习模式,且可以把图学习的能力注入传统的学习任务,实现端到端训练。

按照功能分类,Euler 的核心系统提供的 API 可以分类如下:

全局带权采样点和边的能力。主要用于 mini-batch 样本的随机生成以及 Negative Sampling。

基于给定节点的邻居操作。这个是图计算的核心能力包括邻居带权采样,取 Top 权重的邻居等。

点/边的属性查找。这个能力使得算法可以使用更丰富的特征,而不仅限于点/边的 ID 特征。

三、高层算法实现

目前,Euler 内置的算法如下。除了 LINE 算法,Euler 实现的算法可以分为随机游走与邻居汇聚两大类算法,其中也有阿里妈妈团队自研的开创性算法。

以下是对阿里妈妈内部三个创新算法 Scalable-GCN、LsHNE、LasGNN 的详细介绍:

Scalable-GCN

它是一种高效的 GCN 训练算法。GCN 以及更一般的 Graph Neural Network (GNN)类的方法由于能有效的提取图结构信息,在许多任务上均取得了超过以往方法的效果。但是 GCN 的模型会引入巨大的计算量,导致模型的训练时间不可接受。Scalable-GCN 在保证优秀效果的前提下,把 mini-batch GCN 的计算复杂度从层数的指数函数压到线性。这使得在阿里妈妈的海量数据下应用三层 GCN 成为可能,广告匹配的效果获得了显著提升。

LsHNE

LsHNE 是技术团队结合阿里妈妈搜索广告场景创新地提出一种无监督的大规模异构网络 embedding 学习方法。区别于 DeepWalk 类算法,LsHNE 的特点包括:a) 采用深度神经网络学习表达,可以有效融合 Attribute 信息;b)考虑 embedding 表示的距离敏感需求,提出两个负采样原则:分布一致性原则和弱相关性原则;c)支持异构网络。

LasGNN

LasGNN 是一种半监督的大规模异构图卷积神经网络学习方法, 它有效融合了图结构知识信息和海量用户行为信息,大幅提升了模型精度,是工业界广告场景下首次应用半监督图方法。该方法有多处创新,例如将 metapath 的思想应用于图卷积网络中,并提出了 metapathGCN 模型,有效解决了异构网络的卷积问题;提出了 metapathSAGE 模型,在模型中设计高效的邻居采样的方法,使得大规模的多层邻居卷积成为可能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    3256

    浏览量

    42411
  • 深度学习
    +关注

    关注

    73

    文章

    5493

    浏览量

    120987

原文标题:继 XDL 之后,阿里妈妈开源大规模分布式图表征学习框架 Euler

文章出处:【微信号:worldofai,微信公众号:worldofai】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    阿里开源首个DL框架,新型XDL帮你搞定大规模稀疏数据

    。此外,阿里还配套发布了一系列官方模型,它们都是阿里在实际业务或产品中采用的高效模型。 在XDL开源前夕,记者采访了其团队的四位主要负责人: 靖世,研究员,阿里
    发表于 12-28 17:13 2454次阅读
    <b class='flag-5'>阿里</b>开源首个DL框架,新型XDL帮你搞定大规模稀疏数据

    企业打开Redis的正确方式,来自阿里云云数据库团队解读

    欢迎Key-Value数据库榜首之外,看阿里技术总监为您深度解读云数据库Redis。点此查看原文:http://click.aliyun.com/m/41902/为何Redis成为数据库能成为后起之秀?数据库
    发表于 02-07 14:06

    阿里云全球首次互联网8K直播背后的技术解读

    /v0618atp7nr.html舞台的屏幕上显示了从1300公里以外的阿里巴巴杭州园区传输回来的直播图像视频。现场观众清晰地看到了景泰蓝淘公仔的精致画面。海外的小伙伴也忍不住手动点赞。下面我们将详细解读
    发表于 04-08 10:55

    专访小邪:从十年技术之路看阿里技术体系的变革

    变革2008年入职阿里,到2012年执掌中间件团队,再到如今的阿里云飞天八部负责人,小邪的角色在不停转变,整个阿里技术体系这十年更是迎来了翻
    发表于 05-10 14:40

    企业打开云HBase的正确方式,来自阿里云云数据库团队解读

    :生产部署至少4个节点,起步成本高。原始只有API接口,偏底层,需要较强编程功底。技术资料少。社区活动少。三、技术平民化,阿里云HBase团队在行动为了普及和推广HBase生态,降低H
    发表于 05-31 15:57

    云上拍客梨视频 基于阿里云的技术实践分享

    ,基于云来思考,做技术选型和技术实践,是这么小的团队在如此短的时间做这么多的事情的先决条件。基于云架构的全套架构实践梨视频整套的视频点播、直播的方案都是基于阿里视频云构建的,非常少的代
    发表于 06-28 16:13

    阿里妈妈的深度学习演进之路

    深度学习如何应用在广告、推荐及搜索业务?阿里妈妈实践案例解读
    发表于 09-29 14:15

    阿里云数据库POLARDB核心功能物理复制技术解读

    深入解读阿里云数据库POLARDB核心功能物理复制技术
    发表于 06-02 10:16

    【6.2】技术解读(框架、场景案例解读

    `技术解读(框架、场景案例解读)`
    发表于 06-04 17:12

    SUSE Euler Linux 2.0 通过欧拉开源社区 OSV 产品兼容性认证

    近日,SUSE Euler Linux 2.0 通过了欧拉开源社区的技术测评,完全符合其针对 OSV 的产品兼容性认证,本次认证同时涵盖 x86 和 arm64 两种架构。这表明,SUSE
    发表于 08-10 11:09

    阿里妈妈携手人工智能联合以及阿里云来优化营销业务

    阿里妈妈携手国际人工智能联合会议(IJICAI-18)以及阿里云天池平台,共同启动了“IJCAI 2018阿里妈妈国际广告算法大赛”。
    发表于 06-27 09:50 474次阅读

    开放的社会化大分销_阿里妈妈重磅推出“超新星计划”

    今天下午,阿里妈妈在上海举办了“2018淘宝联盟媒体营销峰会”。作为阿里巴巴集团旗下的大数据营销平台,阿里妈妈一年一度的淘宝联盟峰会已被视为
    的头像 发表于 03-31 09:02 4441次阅读

    阿里团队研发自动驾驶技术_科学家王刚率领研究

    4月16日消息,继百度、腾讯之后,阿里也加入到无人驾驶领域。据《财新》报道,阿里团队正在研发自动驾驶技术,已有车辆进行常态化路测。阿里巴巴官
    发表于 04-18 21:45 906次阅读

    openEuler Summit开发者峰会:SUSE Euler 技术介绍及展望

    openEuler Summit开发者峰会:SUSE Euler 技术介绍及展望
    的头像 发表于 11-10 11:27 1447次阅读
    openEuler Summit开发者峰会:SUSE <b class='flag-5'>Euler</b> <b class='flag-5'>技术</b>介绍及展望

    SUSE正式发布SUSE Euler Linux 2.0

    2022 年 6 月 16 日,SUSE 正式发布 SUSE Euler Linux 2.0。它是基于 openEuler 22.03 LTS 构建的企业级 Linux 操作系统,完全由中国团队打造,能够为中国本土企业提供量身定制的、更加安全可靠的服务。
    的头像 发表于 06-17 10:42 1062次阅读