智源大会 | NVIDIA 科学家深度解析大语言模型训练和 3D 内容创作最新成果-电子发烧友网

北京智源大会是北京智源研究院主办的年度国际性人工智能高端学术交流活动。自 2019 年 10 月首次召开至今，有 8 位图灵奖得主曾参与大会，每年有 200 位顶尖专家出席，来自 30 多个国家和地区的观众齐聚一堂。

今年的大会将于 6 月 9 日至 10 日在北京市海淀区中关村国家自主创新示范区展示中心召开，预计将有超过 3 万名 AI 领域的专业人士在线上或线下参会，分享研究成果，学习前沿知识，交换实践经验，建立联系合作。

大语言模型和生成式 AI 代表了一个新的技术范式，推动着 AI 技术与各行各业的深度融合。

对于 3D 内容创作领域，如何提升数字内容生产力和生成效率，也成为其在大语言模型和生成式 AI 时代亟需思考的问题。

近几年，NVIDIA 推出了一系列全栈式解决方案，以助力满足大语言模型和生成式 AI 爆发式发展下的迅猛需求。在 3D 创作领域，从可逆渲染流程 NVIDIA 3D MoMa，到被美国《时代》周刊评为 2022 年度最佳发明的 NVIDIA Instant NeRF，以及近期在 CVPR 2023 发布的 NVIDIA Neuralangelo，NVIDIA Research 在 3D 视觉领域发布的一系列研究成果也受到广泛关注。

对于 3D 内容创作领域，基于这些大语言模型和生成式 AI 方面的研究进展和技术进步，不仅能够提高设计的速度、准确性、以及建模的效率，创作方式本身也发生了变革。

在明日（6 月 9 日）即将举办的北京智源大会上，来自 NVIDIA 的多位专家也受邀参会发表演讲，包括 NVIDIA 中国区工程和解决方案高级总监赖俊杰，以及来自 NVIDIA 多伦多 AI 实验室的三位研究科学家——NVIDIA 高级研究科学家 Karsten Kreis、NVIDIA 研究科学家高俊、NVIDIA 研究科学家 Huan Ling。

NVIDIA 中国区工程和解决方案高级总监赖俊杰将深度解析 NVIDIA GPU 软硬件结合的技术创新如何推动大模型技术的发展演进，介绍如何基于 NVIDIA Megatron 更高效地构建大语言模型训练系统，在大模型时代提高模型开发效率和模型质量。

来自 NVIDIA 多伦多 AI实验室的研究科学家们将带来两场精彩的学术分享。随着许多行业对创建大规模 3D 虚拟世界的需求不断增加，对多样化和高质量的 3D 内容有巨大的需求。他们将概述 NVIDIA 最近在机器学习和扩散模型方面的工作及其在图像、视频和 3D 内容创建方面的应用，以实现大规模的 3D 内容创作，并将重点介绍在 3D 生成建模方面的不同努力，包括以对象为中心的 3D 合成以及全场景级生成。

AI 系统论坛

基于 NVIDIA Megatron 更高效地

构建大语言模型训练系统

6 月 10 日上午 1045

畅春厅

大语言模型是当今最重要的先进技术之一，NVIDIA 开发的基于 PyTorch 的训练框架 - Megatron 与 NeMo Framework 的开创性技术，能够提高训练速度且可扩展性强，使得大模型的训练和部署变得更加容易，具有更短的时间成本和更快的结果。

本议题将深度解析 NVIDIA GPU 软硬件结合的技术创新如何推动大模型技术的发展演进，NVIDIA Megatron 框架的优化方法，包括其高效的并行策略、内存优化技术等，以及如何利用该框架在大模型时代提高模型开发效率和模型质量。

演讲嘉宾

赖俊杰

NVIDIA 中国区工程和解决方案高级总监

赖俊杰主要负责带领团队对接中国区核心大客户的技术需求，以及开发相应的行业解决方案，定制软件产品等。赖博士本科和硕士就读于清华大学电子工程系，并于法国国家计算机与自动化研究所获得博士学位。博士期间的主要研究方向包括 GPU 架构研究，及 GPU 性能分析模型。赖博士专注在高性能计算、并行计算、人工智能及互联网行业应用，在并行程序的性能分析及性能优化领域有丰富的经验。

视觉与多模态大模型论坛

机器学习促进 3D 内容创作

6 月 9 日下午 1450

静宜厅

随着许多行业对创建大规模 3D 虚拟世界的需求不断增加，对多样化和高质量的 3D 内容有巨大的需求。机器学习的存在使这一追求成为可能。本场演讲将讨论如何从结合可分化等值面和可分化渲染的角度出发，实现大规模的 3D 内容创作，并对现实世界产生影响。

为此，研究中首先介绍了一种基于四面体网格的可微分三维表示法，以实现任意拓扑结构的三维网格的高质量恢复。通过结合可分化的渲染，研究者进一步设计了一个生成模型，能够产生具有复杂纹理和材料的 3D 形状，用于网格生成。研究中所用框架为从文本提示中利用二维扩散模型进行创新的高质量三维网格创建铺平了道路，这使新手的 3D 内容创建更加大众化。

演讲嘉宾

高俊

NVIDIA 研究科学家

高俊是多伦多大学的博士生，由 Sanja Fidler 教授指导。他也是 NVIDIA 多伦多 AI 实验室的一名研究科学家。他的研究兴趣集中在 3D 计算机视觉和计算机图形的交叉领域，特别是开发机器学习工具，以促进大规模的 3D 内容创作并推动现实世界的应用。他的许多贡献已经在产品中实现，包括 NVIDIA Picasso、GANVerse3D、Neural DriveSim 和 Toronto Annotation Suite。他将在 2023 年的 NeurIPS 上担任领域主席。

借助扩散模型进行图像、视频

和 3D 内容创作

6 月 9 日下午 15:35 - 16:20

静宜厅

基于扩散的降噪生成模型激发了深度生成学习的多项突破。本场演讲将概述 NVIDIA 最近在扩散模型方面的工作及其在图像、视频和 3D 内容创建方面的应用。演讲将从对扩散模型的简短介绍开始，讨论大规模文本到图像的生成，然后重点介绍在 3D 生成建模方面开展的多项工作，包括以对象为中心的 3D 合成以及全场景级生成。最后将讨论的是 NVIDIA 最近在使用视频潜在扩散模型生成高分辨率视频方面的工作。研究者将最先进的文本到图像模型 Stable Diffusion 转变为高分辨率文本到视频生成器，还演示了真实野外驾驶场景视频的模拟。

演讲嘉宾

Karsten Kreis

NVIDIA 高级研究科学家

Karsten Kreis 是 NVIDIA 多伦多 AI 实验室的高级研究科学家。在加入 NVIDIA 之前，他在 D-Wave Systems 从事深度生成建模工作，并与他人共同创立了 Variational AI，这是一家利用生成模型进行药物发现的初创公司。在转向深度学习之前，他在马克斯-普朗克光科学研究所获得了量子信息理论硕士学位，并在马克斯-普朗克聚合物研究所获得了计算和统计物理学博士学位。目前，Karsten 的研究重点是开发新的生成学习方法，主要是扩散模型，以及将深度生成模型应用于计算机视觉、图形和数字艺术以及自然科学等领域的问题。

Huan Ling

NVIDIA 研究科学家

Huan Ling 是 NVIDIA 多伦多人工智能实验室的研究科学家，他是多伦多大学 Sanja Fidler 教授的博士生，还是 Vector Institute 的研究员。他的研究重点是大规模生成模型以及将生成模型用于计算机视觉感知任务。他在 NVIDIA 的研究工作包括 DatasetGAN、EditGAN 和 Align your Latents: VideoLDM。

点击“阅读原文”即可报名现场参加各专题论坛或预约线上直播，快来参会吧！

扫描下方海报二维码，观看 NVIDIA 创始人兼 CEO 黄仁勋在 COMPUTEX 2023 的主题演讲直播回放，主题演讲中文字幕版已上线，了解 AI、图形及其他领域的最新进展！

原文标题：智源大会 | NVIDIA 科学家深度解析大语言模型训练和 3D 内容创作最新成果

文章出处：【微信公众号：NVIDIA英伟达】欢迎添加关注！文章转载请注明出处。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

英伟达

英伟达

+关注

关注
22

文章
3780

浏览量
91197

原文标题：智源大会 | NVIDIA 科学家深度解析大语言模型训练和 3D 内容创作最新成果

文章出处：【微信号：NVIDIA_China，微信公众号：NVIDIA英伟达】欢迎添加关注！文章转载请注明出处。

NVIDIA Isaac Sim满足模型的多样化训练需求

光轮智能借助 NVIDIA Isaac Sim，通过 3D 生成与建模技术构建高度逼真的虚拟场景，将现实世界的复杂场景抽象并转化为高质量的训练数据源，从而更有效地满足

发表于 11-23 14:55 •564次阅读

【《大语言模型应用指南》阅读体验】+ 基础知识学习

一些局限性。例如，模型可能无法完全理解文本中的深层含义和语境信息；同时，由于训练数据可能存在偏差和噪声，生成的答案也可能存在不准确或误导性的情况。总结以下，大语言模型通过

发表于 08-02 11:03

大语言模型的预训练

能力，逐渐成为NLP领域的研究热点。大语言模型的预训练是这一技术发展的关键步骤，它通过在海量无标签数据上进行训练，使模型学习到

发表于 07-11 10:11 •439次阅读

llm模型训练一般用什么系统

LLM（Large Language Model，大型语言模型）是近年来在自然语言处理领域取得显著成果的一种深度学习

发表于 07-09 10:02 •423次阅读

Meta推出革命性3D Gen AI模型：1分钟内生成高质量3D内容

在科技日新月异的今天，Meta再次引领创新潮流，宣布了一项令人瞩目的技术突破——3D Gen AI模型的诞生。这款先进的模型以其前所未有的高效性与卓越品质，重新定义了3D

发表于 07-04 18:12 •1034次阅读

深度学习模型训练过程详解

深度学习模型训练是一个复杂且关键的过程，它涉及大量的数据、计算资源和精心设计的算法。训练一个深度学习模型

发表于 07-01 16:13 •1305次阅读

新华社：突破性成果！祝贺我国科学家成功研发这一传感器！

6月25日，新华社以《突破性成果！祝贺我国科学家》为标题，报道了由我国科学家研发的传感器成果。我国科学家研发高通道神经探针实现猕猴全脑尺度

发表于 06-27 18:03 •508次阅读

奥比中光3D相机打造高质量、低成本的3D动作捕捉与3D动画内容生成方案

高质量、低成本的3D动作捕捉与3D动画内容生成方案。 Moverse公司总部位于希腊塞萨洛尼基，是三维动画相关媒体和娱乐行业的一家科技创业公司。基于奥比中光3D相机，Moverse可以

发表于 06-25 16:37 •1089次阅读

3D建模的重要内容和应用

3D建模是一种技术，通过计算机软件创建虚拟三维模型，模拟现实世界中的物体或场景。这项技术广泛应用于建筑设计、电影制作、游戏开发、工程仿真等领域。下面古河云科技将介绍一些与3D建模相关的重要内容

发表于 06-21 14:48 •648次阅读

【大语言模型：原理与工程实践】大语言模型的预训练

大语言模型的核心特点在于其庞大的参数量，这赋予了模型强大的学习容量，使其无需依赖微调即可适应各种下游任务，而更倾向于培养通用的处理能力。然而，随着学习容量的增加，对预训练数据的需求也相

发表于 05-07 17:10

【大语言模型：原理与工程实践】揭开大语言模型的面纱

大语言模型（LLM）是人工智能领域的尖端技术，凭借庞大的参数量和卓越的语言理解能力赢得了广泛关注。它基于深度学习，利用神经网络框架来理解和生成自然语

发表于 05-04 23:55

NVIDIA加速微软最新的Phi-3 Mini开源语言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM

发表于 04-28 10:36 •583次阅读

ad19中3d模型不显示？

封装库导入3d模型不显示，但导入3d模型后的封装库生成pcb文件时显示3d模型，这是什么原因导致

发表于 04-24 13:41

NVIDIA生成式AI研究实现在1秒内生成3D形状

NVIDIA 研究人员使 LATTE3D （一款最新文本转 3D 生成式 AI 模型）实现双倍加速。

发表于 03-27 10:28 •510次阅读

NVIDIA首席科学家Bill Dally：深度学习硬件趋势

Bill Dally于2009年1月加入NVIDIA担任首席科学家，此前在斯坦福大学任职12年，担任计算机科学系主任。Dally及其斯坦福团队开发了系统架构、网络架构、信号传输、路由和同步技术，在今天的大多数大型并行计算机中都可

发表于 02-25 16:16 •1179次阅读

搜索历史

智源大会 | NVIDIA 科学家深度解析大语言模型训练和 3D 内容创作最新成果

评论

NVIDIA Isaac Sim满足模型的多样化训练需求

【《大语言模型应用指南》阅读体验】+ 基础知识学习

大语言模型的预训练

llm模型训练一般用什么系统

Meta推出革命性3D Gen AI模型：1分钟内生成高质量3D内容

深度学习模型训练过程详解

新华社：突破性成果！祝贺我国科学家成功研发这一传感器！

奥比中光3D相机打造高质量、低成本的3D动作捕捉与3D动画内容生成方案

3D建模的重要内容和应用

【大语言模型：原理与工程实践】大语言模型的预训练

【大语言模型：原理与工程实践】揭开大语言模型的面纱

NVIDIA加速微软最新的Phi-3 Mini开源语言模型

ad19中3d模型不显示？

NVIDIA生成式AI研究实现在1秒内生成3D形状

NVIDIA首席科学家Bill Dally：深度学习硬件趋势