英伟达推出归一化Transformer，革命性提升LLM训练速度-电子发烧友网

英伟达推出归一化Transformer，革命性提升LLM训练速度

英伟达团队近日在AI领域投下了一枚震撼弹，他们提出了一种全新的神经网络架构——归一化Transformer(nGPT)。这一创新架构基于超球面(hypersphere)进行表示学习，为AI领域带来了新的突破。

相较于传统的Transformer架构，nGPT在保持原有精度的同时，直接将大型语言模型(LLM)的训练速度提升了高达20倍。这一显著的性能提升，无疑将极大地推动AI技术的发展和应用。

在nGPT中，所有的向量(包括嵌入向量、多层感知机(MLP)向量、注意力矩阵向量以及隐藏状态向量)都被归一化为单位范数(unit norm)。这一设计不仅简化了模型训练过程，还提高了模型的稳定性和泛化能力。

英伟达团队的这一创新成果，无疑为AI领域注入了新的活力。nGPT架构的提出，不仅将推动AI技术的进一步发展，还将为各种应用场景提供更加高效、准确的解决方案。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4771

浏览量
100719
英伟达

英伟达

+关注

关注
22

文章
3771

浏览量
90991
Transformer

Transformer

+关注

关注
0

文章
143

浏览量
5995
LLM

LLM

+关注

关注
0

文章
286

浏览量
327

什么是LLM？LLM在自然语言处理中的应用

随着人工智能技术的飞速发展，自然语言处理（NLP）领域迎来了革命性的进步。其中，大型语言模型（LLM）的出现，标志着我们对语言理解能力的一次飞跃。LLM通过深度学习和海量数据

发表于 11-19 15:32 •528次阅读

如何训练自己的LLM模型

训练自己的大型语言模型（LLM）是一个复杂且资源密集的过程，涉及到大量的数据、计算资源和专业知识。以下是训练LLM模型的

发表于 11-08 09:30 •507次阅读

LLM和传统机器学习的区别

和训练方法 LLM：预训练和微调： LLM通常采用预训练（Pre-training）和微调（Fine-tuning）的方法。预

发表于 11-08 09:25 •409次阅读

英伟达Blackwell可支持10万亿参数模型AI训练，实时大语言模型推理

、NVLink交换机、Spectrum以太网交换机和Quantum InfiniBand交换机。英伟达称，Blackwell拥有6项革命性技术，可支持多达10万亿参数的模型进行AI训练

发表于 09-04 09:10 •2891次阅读

英伟达推出创新液冷技术

英伟达，这家领先的AI芯片制造商，近期在散热技术上实现了重大突破，推出了创新的液冷技术。其即将问世的GB200服务器机架，将采用革命性的液体冷却方式，摒弃传统空气冷却，通过液体在硬件管

发表于 08-13 15:24 •791次阅读

llm模型训练一般用什么系统

LLM（Large Language Model，大型语言模型）是近年来在自然语言处理领域取得显著成果的一种深度学习模型。它通常需要大量的计算资源和数据来进行训练。以下是关于LLM模型

发表于 07-09 10:02 •398次阅读

llm模型有哪些格式

：基于Transformer的模型 Transformer是一种基于自注意力机制的模型，广泛应用于NLP领域。基于Transformer的LLM

发表于 07-09 09:59 •596次阅读

英伟达推出AI模型推理服务NVIDIA NIM

英伟达近日宣布推出一项革命性的AI模型推理服务——NVIDIA NIM。这项服务将极大地简化AI模型部署过程，为全球的2800万

发表于 06-04 09:15 •674次阅读

【大规模语言模型：从理论到实践】- 每日进步一点点

的训练效率、稳定性和泛化能力。以下是关于大模型训练归一化的详细介绍：一、归一化的目的和重要

发表于 05-31 19:54

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

2024年3月19日，[英伟达]CEO[黄仁勋]在GTC大会上公布了新一代AI芯片架构BLACKWELL，并推出基于该架构的超级芯片GB200，将助推数据处理、工程模拟、电子设计自动

发表于 05-13 17:16

英伟达推出有2080亿晶体管的GB200处理器

英伟达在最新一届的GTC大会上隆重推出了全新的GB200处理器，这款处理器基于革命性的Blackwell架构，并配备了惊人的2080亿个晶体

发表于 03-20 11:10 •778次阅读

英伟达发布新一代AI芯片B200

在美国加州圣何塞举办的英伟达GTC生态大会上，英伟达CEO黄仁勋以一场震撼人心的演讲，正式推出了

发表于 03-20 10:07 •966次阅读

英伟达发布性能大幅提升的新款B200 AI GPU

英伟达宣称，B200在性能上比以往最好的GPU快30倍不止。由它构成的服务器集群相比上一代，运算能力飞跃性提升，甚至能使大语言模型的

发表于 03-20 09:37 •790次阅读

长电科技推出了一项革命性的高精度热阻测试与仿真模拟验证技术

在芯片封装技术日益迈向高密度、高性能的今天，长电科技引领创新，推出了一项革命性的高精度热阻测试与仿真模拟验证技术。

发表于 03-08 13:33 •526次阅读

英伟达推出新产品，助力AIPC实现革命性升级

一直以来，英伟达的竞争对手如英特尔与AMD均对“AI PC”寄予厚望。他们认为，AI软件在PC端运行会比依赖网络更为安全且响应速度更快。由此可见，英

发表于 01-09 14:43 •609次阅读

搜索历史

英伟达推出归一化Transformer，革命性提升LLM训练速度

评论

什么是LLM？LLM在自然语言处理中的应用

如何训练自己的LLM模型

LLM和传统机器学习的区别

英伟达Blackwell可支持10万亿参数模型AI训练，实时大语言模型推理

英伟达推出创新液冷技术

llm模型训练一般用什么系统

llm模型有哪些格式

英伟达推出AI模型推理服务NVIDIA NIM

【大规模语言模型：从理论到实践】- 每日进步一点点

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

英伟达推出有2080亿晶体管的GB200处理器

英伟达发布新一代AI芯片B200

英伟达发布性能大幅提升的新款B200 AI GPU

长电科技推出了一项革命性的高精度热阻测试与仿真模拟验证技术

英伟达推出新产品，助力AIPC实现革命性升级