0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CNCC | 论坛:探索 AI 全栈解决方案和基于 LLM 的推理与部署实践

NVIDIA英伟达 来源:未知 2023-10-24 10:30 次阅读

2023 年中国计算机大会(CNCC2023)以“发展数字基础设施,支撑数字中国建设”为主题,将于 10 月 26 - 28 日在沈阳新世界博览馆举办。

NVIDIA 携手合作伙伴丽台科技受邀为大会带来三大技术论坛,并在展位开设持续两天的开发者小课堂,为计算机行业的学者、研究人员、开发者和高校的同学们带来 NVIDIA 的最新技术应用实践。欢迎莅临我们的展位(沈阳新世界博览馆 4 楼 C 展馆 T13),与我们一起探索 AI加速计算的未来,开启生成式 AI 新时代!

NVIDIA 在 CNCC2023 的活动概览:

时间

主题

地点

10 月 26 日

13:30 - 17:30

NVIDIA AI 全栈技术解决方案研讨会

沈阳皇朝万鑫酒店

8 层 - 16

10 月 27 日

13:30 - 17:30

基于超大模型的推理和部署实践

沈阳新世界博览馆

5 层会议室 503

10 月 28 日

13:30 - 17:30

探索 Omniverse和AI加速创作开发流程

沈阳皇朝万鑫酒店

8 层 - 19

10 月 26 日

– 27 日

开发者小课堂

沈阳新世界博览馆

4 楼 C 展馆 T13

10 月 26 – 27 日,NVIDIA 将举办两场技术论坛:NVIDIA AI 全栈技术解决方案研讨会和基于超大模型的推理和部署实践分论坛,我们将分享 AI 领域最新的发展趋势,探讨大语言模型的崛起如何为 AI 技术的应用开拓新领域。

论坛详情

NVIDIA AI 全栈技术解决方案研讨会

时间:10 月 26 日 13:30 - 17:30

地点:沈阳皇朝万鑫酒店 8 层 - 16

AI 正迎来有史以来最辉煌的时刻,新的 AI 技术和迅速发展的应用正在改变各行各业。从自主机器人开发、自动驾驶系统和软件、GPU 加速的大语言模型以及火热的生成式 AI 背后的智能网络技术。在 NVIDIA AI 全栈技术解决方案论坛,NVIDIA 专家将为您揭示 AI 技术新趋势。

+

+

具体议程

面向生成式 AI 的端到端高性能网络关键技术

演讲时间:13:35 - 14:20

演讲简介:分享 Spectrum-X 平台技术创新及其在 AI Cloud 行业的应用介绍 Quantum 平台及网络计算技术对大规模生成式 AI 应用的加速。

-------------------------

wKgZomU3LVmAY53IAAAt4J-yd80838.jpg

冯高锋

NVIDIA HPC-AI 技术市场高级总监

构建 LLM 大规模训练推理基础架构的最佳实践(网络篇)

演讲时间:14:20 - 15:05

演讲简介:以当前火热的大语言模型(LLM)生成式人工智能为切入点,探索其成功背后的全栈智能网络技术,并介绍 NVIDIA BlueField-3 DPU 和 NVIDIA DOCA 2.0 为加速计算提供高性能、高效率和高安全性的云计算基础设施。

-------------------------

wKgZomU3LVmAERMgAAAOztQ4g4s744.jpg

王淼

NVIDIA 解决方案总监

NVIDIA 互联网行业 Infra 方向技术负责人

构建 LLM 大规模训练推理基础架构的最佳实践(GPU 篇)

演讲时间:15:05 - 15:50

演讲简介:介绍 NVIDIA 在 LLM 训练和推理场景的基础架构层面的最佳产品和方案。NVIDIA DGX SuperPOD 架构是实现 LLM 训练的最高性能基础架构,由 NVIDIA 实现全栈交付,极致满足客户算力需求。同时,NVIDIA Hopper NVL 产品可灵活适配主流服务器,在 LLM 推理场景帮助客户实现更高收益。

-------------------------

wKgZomU3LVmAJmh1AAA8y-OPnN0275.jpg

艾静

NVIDIA 解决方案架构师

市场高级总监

NVIDIA 加速边缘计算和自主机器开发

演讲时间:15:50 - 16:35

演讲简介:智能机器人和边缘计算是现在人工智能的一个热点,NVIDIA 提供软硬件全栈解决方案,从仿真开发到部署,助力边缘计算和智能机器人应用的实现。同时,丰富强大的生态帮助开发者和用户加速开发过程,轻松应对全行业应用。

-------------------------

wKgZomU3LVqAKuGJAAAqAq-NnYc657.jpg

李雨倩

NVIDIA 开发者关系总监

NVIDIA 全栈加速自动驾驶开发

演讲时间:16:35 - 17:20

演讲简介:围绕着自动驾驶整个数据闭环开发,NVIDIA 提供全栈的解决方案,从硬件、系统到软件,从数据中心到车端,助力自动驾驶高效开发、快速迭代。

-------------------------

wKgZomU3LVqAKcf_AAA8V_d81Pk744.jpg

程帅

NVIDIA 解决方案架构师

基于超大模型的推理和部署实践分论坛

时间:10 月 27 日 13:30 - 17:30

地点:沈阳新世界博览馆5层会议室503

大语言模型的兴起为 AI 技术的应用开辟了更广阔的空间,越来越多研究和实践证明超大模型在各类任务上的卓越能力与重要性。在 CNCC2023 大会上,腾讯、百度和阿里云将携手 NVIDIA 带来《基于超大模型的推理和部署实践》论坛。

通过本次论坛,您将了解到腾讯的生成式 AI 如何高效地部署;百度飞桨在 LLM 分布式训练方面的最新技术;阿里云 PAI 大语言模型推理服务实践;NVIDIA 在 GPU LLM 训练与推理部署优化解决方案以及构建 LLM 大规模训练推理基础架构的最佳实践分享。

+

+

具体议程

生成式 AI 高效部署实践

演讲时间:13:35 - 14:20

演讲简介:自 OpenAI 推出 ChatGPT 后,市场反应强烈。国内外科技公司快速跟进,到今年三月份,各公司逐步推出其专属的 ChatGPT 版本,并基于此开发逐步研发相关的商业应用。而 GPT 超大的模型结构在部署时产生的高延迟,高成本是其商业化路上的最大障碍。我们将从小型化算法、推理框架及服务化部署等多个方面和大家分享工业级 GPT 高效部署优化方案。

-------------------------

wKgZomU3LVqAJTRzAAAcHutI8Zo633.jpg

刘凯

腾讯高级工程师

基于飞桨的 LLM 训练和应用实践

演讲时间:14:20 - 15:05

演讲简介:介绍飞桨在 LLM 分布式训练方面的最新技术,针对 LLM 的开发、训练、Tuning、推理全流程工具设计,以及实际大规模训练和部署的应用实践。

-------------------------

wKgZomU3LVqAQ-7zAAA-6r81wxQ560.jpg

曾锦乐

百度资深工程师

GPU LLM 训练与推理部署优化实践与解决方案

演讲时间:15:05 - 15:50

演讲简介:介绍大语言模型训练推理中常用的优化支持和技巧(数据并行、Tensor 并行、Pipline 并行、Sequence并行、selective activation recompute、NCCL、TRTLLM 等)以及 Nemo framework 的全链路支持方案。

-------------------------

wKgZomU3LVqAKlOrAABHQ_A69O4004.jpg

高慧怡

NVIDIA 解决方案架构师

阿里云 PAI 大语言模型推理服务实践

演讲时间:15:50 - 16:35

演讲简介:大语言模型的兴起为人工智能技术的应用开辟了更广阔的空间。然而,大语言模型的训练和推理都需要大量的计算资源和时间,因此,性能和成本是大语言模型普及路上的重要挑战。演讲将主要介绍阿里云 PAI 平台为了应对这一挑战所做的工作,包括:

1)如何基于推理加速技术在 GPU 特别是 NVIDIA 平台上实现了大语言模型推理的高效推理;

2)如何利用云平台天然的弹性特性,通过资源调度降低用户的成本;

3)如何在保证性能和成本的前提下保持灵活性,支持社区百花齐放的大语言模型。

-------------------------

wKgZomU3LVuAMfNKAAB7CSwC6yM384.jpg

邱侠斐

阿里云机器学习平台(PAI)系统优化团队负责人

构建 LLM 大规模训练推理基础架构的最佳实践(基础架构篇)

演讲时间:16:35 - 17:20

演讲简介:介绍 NVIDIA 在 LLM 训练和推理场景的基础架构层面的最佳产品和方案。NVIDIA DGX SuperPOD 架构是实现 LLM 训练的最高性能基础架构,由 NVIDIA 实现全栈交付,极致满足客户算力需求。同时,NVIDIA Hopper NVL 产品可灵活适配主流服务器,在 LLM 推理场景帮助客户实现更高收益。

-------------------------

wKgZomU3LVmAJmh1AAA8y-OPnN0275.jpg

艾静

NVIDIA 解决方案架构师

内容分享后更有问答交流环节,现场专家阵容将悉心为您答疑解惑!

报名参会

扫描下方二维码,即刻报名参与论坛。

期待您莅临现场,一起领略更多精彩!

wKgZomU3LVuAIcWZAABRwoeGjGE484.jpg

您可以从CNCC2023 | 开启生成式 AI 新时代!NVIDIA 多场论坛下周重磅登场全面了解 NVIDIA 在 CNCC 的活动概览。

后续我们还将为您呈现关于探索 Omniverse 和 AI 加速创作开发流程论坛的详细信息,请持续关注我们。

GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。点击“阅读原文”扫描下方海报二维码,关注更多会议及活动信息。

wKgZomU3LVuAR-wKAAFtccdApf0933.jpg


原文标题:CNCC | 论坛:探索 AI 全栈解决方案和基于 LLM 的推理与部署实践

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3739

    浏览量

    90789

原文标题:CNCC | 论坛:探索 AI 全栈解决方案和基于 LLM 的推理与部署实践

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    中兴通讯推出AI FWA解决方案

    近日,在土耳其伊斯坦布尔举办的终端用户大会上,作为全球领先的综合信息与通信技术解决方案提供商中兴通讯,首次聚焦固定无线接入(FWA)与移动宽带(MBB)业务领域,并隆重推出了业界首创的AI FWA
    的头像 发表于 11-18 17:10 397次阅读

    NVIDIA生成式AI闪耀CNCC2024大会

    在当前数字化转型的浪潮中,探索生成式 AI 如何对新质生产力提供强力赋能,正成为推动社会进步的重要课题。此前,10 月 24 - 26 日在横店举行的 CNCC2024 大会上,这一议题被视为核心讨论内容。
    的头像 发表于 11-06 14:04 194次阅读

    NVIDIA助力丽蟾科技打造AI训练与推理加速解决方案

    丽蟾科技通过 Leaper 资源管理平台集成 NVIDIA AI Enterprise,为企业和科研机构提供了一套高效、灵活的 AI 训练与推理加速解决方案。无论是在复杂的
    的头像 发表于 10-27 10:03 160次阅读
    NVIDIA助力丽蟾科技打造<b class='flag-5'>AI</b>训练与<b class='flag-5'>推理</b>加速<b class='flag-5'>解决方案</b>

    软通动力成功举办“智能,激发工业发展新动能”分论坛

    软通动力在华为联接大会2024上举办"智能,激发工业发展新动能"分论坛,汇聚伙伴/客户进行AI+行业
    的头像 发表于 09-27 15:33 291次阅读

    联想集团携AI解决方案亮相2024年云栖大会

    在万众瞩目的2024年云栖大会上,联想集团首次以震撼姿态展露了其AI解决方案的宏伟蓝图,全方位覆盖从AI终端、基础设施到
    的头像 发表于 09-20 16:36 679次阅读

    AMD助力HyperAccel开发全新AI推理服务器

    HyperAccel 是一家成立于 2023 年 1 月的韩国初创企业,致力于开发 AI 推理专用型半导体器件和硬件,最大限度提升推理工作负载的存储器带宽使用,并通过将此解决方案应用于
    的头像 发表于 09-18 09:37 328次阅读
    AMD助力HyperAccel开发全新<b class='flag-5'>AI</b><b class='flag-5'>推理</b>服务器

    基于Arm平台的服务器CPU在LLM推理方面的能力

    部署任务的默认首选平台。但在推理领域,除了 GPU 和加速器之外,还有其他可行的选择。长期以来,CPU 一直被用于传统的 AI 和机器学习 (ML) 用例,由于 CPU 能够处理广泛多样的任务且
    的头像 发表于 09-02 10:39 333次阅读
    基于Arm平台的服务器CPU在<b class='flag-5'>LLM</b><b class='flag-5'>推理</b>方面的能力

    开启全新AI时代 智能嵌入式系统快速发展——“第六届国产嵌入式操作系统技术与产业发展论坛”圆满结束

    操作系统标准化的最新进展。 华为计算产业战略规划总监周明耀在论坛上做了“华为在AI软硬件上积累及生态战略”专题报告。周明耀介绍华为计算产业在AI软硬件
    发表于 08-30 17:24

    三行代码完成生成式AI部署

    LLM加载与推理部署能力,实现了OpenVINO对CNN网络、生成式模型、LLM网络主流模型的全面推理支持。
    的头像 发表于 08-30 16:49 377次阅读
    三行代码完成生成式<b class='flag-5'>AI</b><b class='flag-5'>部署</b>

    魔搭社区借助NVIDIA TensorRT-LLM提升LLM推理效率

    “魔搭社区是中国最具影响力的模型开源社区,致力给开发者提供模型即服务的体验。魔搭社区利用NVIDIA TensorRT-LLM,大大提高了大语言模型的推理性能,方便了模型应用部署,提高了大模型产业应用效率,更大规模地释放大模型的
    的头像 发表于 08-23 15:48 374次阅读

    LLM大模型推理加速的关键技术

    LLM(大型语言模型)大模型推理加速是当前人工智能领域的一个研究热点,旨在提高模型在处理复杂任务时的效率和响应速度。以下是对LLM大模型推理加速关键技术的详细探讨,内容将涵盖模型压缩、
    的头像 发表于 07-24 11:38 762次阅读

    宁畅推出“液”AI基础设施方案

    近日,宁畅科技正式发布其“液”AI基础设施方案,这一创新举措旨在全面支持大模型落地所需的各项技术需求。该
    的头像 发表于 05-31 09:18 582次阅读

    广和通AIoT解决方案助力AI之眼探索视界

    广和通深度探索计算机视觉的关键技术与难点,助力客户实现计算机视觉端侧部署,以高算力模组及解决方案大大简化智能终端视觉部署的难度。
    的头像 发表于 04-23 18:07 576次阅读

    广和通AIoT解决方案助力AI之眼探索视界

    广和通深度探索计算机视觉的关键技术与难点,助力客户实现计算机视觉端侧部署,以高算力模组及解决方案大大简化智能终端视觉部署的难度。
    的头像 发表于 04-23 18:07 258次阅读
    广和通AIoT<b class='flag-5'>解决方案</b>助力<b class='flag-5'>AI</b>之眼<b class='flag-5'>探索</b>视界

    自然语言处理应用LLM推理优化综述

    当前,业界在将传统优化技术引入 LLM 推理的同时,同时也在探索从大模型自回归解码特点出发,通过调整推理过程和引入新的模型结构来进一步提升推理
    发表于 04-10 11:48 549次阅读
    自然语言处理应用<b class='flag-5'>LLM</b><b class='flag-5'>推理</b>优化综述