本次 GTC 大会,来自阿里云机器学习平台 PAI 的技术专家,将分享开源产品 DeepRec 的高性能 GPU 训练推理优化,以及机器学习模型中访存密集型计算 STITCH 融合优化技术。
长按扫描下方二维码,或点击阅读原文,注册 GTC 并提前收藏阿里云机器学习平台 PAI 的精彩演讲。
全球 AI 市场近年来保持了快速增长的趋势,根据市场研究机构 IDC 的数据显示,预计到 2025 年,全球 AI 市场规模将达到 1.25 万亿美元。同时,中国已成为全球最大的 AI 应用市场之一,据中国电子信息产业发展研究院发布的数据显示,截至 2022 年底,国内 AI 产业规模达到 1204 亿元人民币,同比增长 59.5%。
并且随着近阶段 AIGC(AI generated content)概念的爆火,人工智能再次受到全球社会层面的广泛关注。AIGC 能够带来更加创新的应用,包括坐席辅助、智能语音、自动驾驶、人脸识别、扩展现实、机器翻译以及金融欺诈检测等多个领域,潜力极大。
而在 AIGC 浪潮不断带来新惊喜的同时,今天 AI 开发门槛高仍然是亟待解决的问题。因硬件、框架和开发环境三者之间的适配度低,算法工程师们不得不关注底层基础设施的调优和适配工作,无形中降低了工作效率。
阿里云机器学习 PAI 团队致力于为企业和开发者们提供云原生、高性能的 AI 平台服务。在计算性能方面,专注于 AI 训练、AI 推理等方面的软硬协同优化工作,开源了丰富的工具套件。在平台能力方面,PAI 团队推出覆盖 AI 开发全链路的平台产品,兼容各类底层计算硬件和 AI 框架,让算法工程师们可以专注于 AI 开发的阶段,实现云、端侧、创新硬件等多种场景的创新。
以下为阿里云机器学习平台 PAI 在本次 GTC 大会的演讲简介:
阿里云机器学习平台 PAI 演讲推荐
DeepRec: 面向推荐场景的
高性能深度学习框架
会议代码:[S51544]
演讲时间:3 月 23 日 3:00 PM
演讲嘉宾:
刘童璇,阿里巴巴高级技术专家
刘仕杰,NVIDIA GPU 计算专家团队工程师
演讲概要:
DeepRec 支持了淘宝搜索、猜你喜欢、定向、直通车等核心业务,支撑着千亿特征、万亿样本超大规模的搜索、推荐、广告场景的模型训练和推理。自 DeepRec 开源以来,已有数十家互联网公司将 DeepRec 应用在他们的搜推广场景的业务中,取得了显著的业务效果提升和性能提升。DeepRec 中提供的功能和性能优化主要分三个方面:1. 模型效果方面;2. 训练和推理优化方面;3. 模型部署方面。
本次演讲中,主要介绍 GPU 场景下,DeepRec 中多级 Embedding 混合存储功能,图感知的内存/显存分配器,SessionGroup 中多 CUDA Stream 支持,基于 NVIDIA Merlin HugeCTR SOK(Sparse Operation Kit)的 GPU 同步训练,以及Embedding 性能优化 Group Embedding。
您可以在 github 上体验 DeepRec:
https://github.com/alibaba/DeepRec
机器学习模型中访存
密集型计算 STITCH 融合优化技术
会议代码:[SE51289]
演讲时间:3 月 22 日2:00 PM
演讲嘉宾:
郑桢,阿里巴巴高级技术专家
演讲概要:
近年来,访存密集型计算日益成为影响机器学习模型性能的重要因素。由于机器学习模型计算图日趋复杂,传统的机器学习编译器面对复杂的数据依赖关系时很难执行高效的计算融合优化。同时,动态张量形状(dynamic tensor shape)的模型优化需求开始兴起,缺失的张量形状使得访存密集型计算子图的性能优化变得更加困难。
本次演讲将讲述阿里巴巴针对机器学习任务中访存密集型计算性能优化的关键技术:STITCH 融合技术。该技术支持将任意类型及任何数量的机器学习访存密集型算子进行融合,最终将大粒度的访存密集型计算子图转化为单个的 GPU 核函数,以减少片外访存、框架调度及 GPU 核函数调用开销。
如何预约和注册
在 GTC 大会官网(https://www.nvidia.cn/gtc-global/)搜索会议代码找到该演讲,点击“Add to Schedule”或右上角五角星,提前预约或收藏。
如下图 [S51544] 演讲,点击“Add to Schedule”或右上角五角星,即可添加至您的日程。
GTC 大会注册流程请参看 GTC23 注册教程,请在 3 月 26 日前完成在线注册,免费观看以及回看 GTC 2023 春季大会超过 650 场精彩内容!
扫描下方海报二维码,锁定 NVIDIA 创始人兼首席执行官黄仁勋的 GTC 主题演讲!北京时间 3 月 21 日 23:00 全球首播,3 月 22 日 10:00 中国重播。深度解读 NVIDIA 加速计算平台如何推动人工智能、元宇宙、云技术和可持续计算的下一波浪潮。加入 GTC23,切勿错过 AI 的决定性时刻!
原文标题:GTC23 | 阿里云机器学习平台 PAI 精选演讲推荐
文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。
-
英伟达
+关注
关注
22文章
3740浏览量
90794
原文标题:GTC23 | 阿里云机器学习平台 PAI 精选演讲推荐
文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论