浪潮信息发布源2.0-M32开源大模型，模算效率大幅提升-电子发烧友网

5月28日，浪潮信息发布“源2.0-M32”开源大模型。“源2.0-M32”在基于”源2.0”系列大模型已有工作基础上，创新性地提出和采用了“基于注意力机制的门控网络”技术，构建包含32个专家（Expert）的混合专家模型（MoE），并大幅提升了模型算力效率，模型运行时激活参数为37亿，在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。

■ 算法层面，源2.0-M32提出并采用了一种新型的算法结构：基于注意力机制的门控网络（Attention Router），针对MoE模型核心的专家调度策略，这种新的算法结构关注专家模型之间的协同性度量，有效解决传统门控网络下，选择两个或多个专家参与计算时关联性缺失的问题，使得专家之间协同处理数据的水平大为提升。源2.0-M32采用源2.0-2B为基础模型设计，沿用并融合局部过滤增强的注意力机制（LFA, Localized Filtering-based Attention），通过先学习相邻词之间的关联性，然后再计算全局关联性的方法，能够更好地学习到自然语言的局部和全局的语言特征，对于自然语言的关联语义理解更准确，进而提升了模型精度。

Figure1基于注意力机制的门控网络（Attention Router）

■ 数据层面，源2.0-M32基于2万亿的token进行训练、覆盖万亿量级的代码、中英文书籍、百科、论文及合成数据。大幅扩展代码数据占比至47.5%，从6类最流行的代码扩充至619类，并通过对代码中英文注释的翻译，将中文代码数据量增大至1800亿token。结合高效的数据清洗流程，满足大模型训练“丰富性、全面性、高质量”的数据集需求。基于这些数据的整合和扩展，源2.0-M32在代码生成、代码理解、代码推理、数学求解等方面有着出色的表现。

■ 算力层面，源2.0-M32采用了非均匀流水并行的方法，综合运用流水线并行+数据并行的策略，显著降低了大模型对芯片间P2P带宽的需求，为硬件差异较大训练环境提供了一种高性能的训练方法。针对MoE模型的稀疏专家计算，采用合并矩阵乘法的方法，模算效率得到大幅提升。

基于在算法、数据和算力方面全面创新，源2.0-M32的性能得以大幅提升，在多个业界主流的评测任务中，展示出了较为先进的能力表现，在MATH（数学竞赛）、ARC-C（科学推理）榜单上超越了拥有700亿参数的LLaMA3大模型。

Figure2 源2.0-M32业界主流评测任务表现

源2.0-M32大幅提升了模型算力效率，在实现与业界领先开源大模型性能相当的同时，显著降低了在模型训练、微调和推理所需的算力开销。在模型推理运行阶段，M32处理每token所需算力为7.4GFLOPs，而LLaMA3-70B所需算力为140GFLOPs。在模型微调训练阶段，对1万条平均长度为1024 token的样本进行全量微调，M32消耗算力约0.0026PD(PetaFLOPs/s-day)，而LLaMA3消耗算力约为0.05PD。M32凭借特别优化设计的模型架构，在仅激活37亿参数的情况下，取得了和700亿参数LLaMA3相当的性能水平，而所消耗算力仅为LLaMA3的1/19，从而实现了更高的模算效率。

浪潮信息人工智能首席科学家吴韶华表示：当前业界大模型在性能不断提升的同时，也面临着所消耗算力大幅攀升的问题，对企业落地应用大模型带来了极大的困难和挑战。源2.0-M32是浪潮信息在大模型领域持续耕耘的最新探索成果，通过在算法、数据、算力等方面的全面创新，M32不仅可以提供与业界领先开源大模型相当的性能，更可以大幅降低大模型所需算力消耗。大幅提升的模算效率将为企业开发应用生成式AI提供模型高性能、算力低门槛的高效路径。M32开源大模型配合企业大模型开发平台EPAI（Enterprise Platform of AI），将助力企业实现更快的技术迭代与高效的应用落地，为人工智能产业的发展提供坚实的底座和成长的土壤，加速产业智能化进程。

审核编辑：刘清

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1791

文章
47135

浏览量
238113
大模型

大模型

+关注

关注
2

文章
2406

浏览量
2621
生成式AI

生成式AI

+关注

关注
0

文章
499

浏览量
470

原文标题：浪潮信息发布源2.0-M32开源大模型，模算效率大幅提升，37亿激活参数性能对标LLaMA3-700亿

文章出处：【微信号：浪潮AIHPC，微信公众号：浪潮AIHPC】欢迎添加关注！文章转载请注明出处。

浪潮信息发布“源”Yuan-EB助力RAG检索精度新高

近日，浪潮信息发布 “源”Yuan-EB（Yuan-embedding-1.0，嵌入模型），在C-MTEB榜单中斩获检索任务第一名，以78.41的平均精度刷新大

发表于 11-26 13:54 •165次阅读

<b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>“<b class='flag-5'>源</b>”Yuan-EB助力RAG检索精度新高

浪潮信息发布KOS AI定制版，大幅提升大模型训练效率

浪潮信息近期推出了“元脑服务器操作系统KOS AI定制版”，为人工智能领域带来了革命性的变化。这款定制版操作系统通过简单的两步操作，即可实现大模型训练环境的快速部署。

发表于 10-30 17:23 •498次阅读

浪潮信息源2.0大模型与百度PaddleNLP全面适配

近日，浪潮信息宣布其开源大模型源2.0已全面适配百度PaddleNLP。这一举措标志着大模型开发

发表于 10-17 18:15 •507次阅读

浪潮信息：元脑企智EPAI助力金融大模型快速落地

将浪潮信息在AI算力底座建设、大模型开发领域积累的成熟、成功经验工具化，助力金融机构又快、又稳地部署生成式AI应用，助力金融数智化跨越式发展。

发表于 09-20 16:07 •335次阅读

<b class='flag-5'>浪潮信息</b>：元脑企智EPAI助力金融大<b class='flag-5'>模型</b>快速落地

源2.0-M32大模型发布量化版运行显存仅需23GB 性能可媲美LLaMA3

北京2024年8月23日 /美通社/ -- 近日，浪潮信息发布源2.0-M32大模型4bit和8bit量化版，性能比肩700亿参数的LLaM

发表于 08-25 22:06 •293次阅读

<b class='flag-5'>源</b><b class='flag-5'>2.0-M32</b>大<b class='flag-5'>模型</b><b class='flag-5'>发布</b>量化版运行显存仅需23GB 性能可媲美LLaMA3

浪潮信息携全栈智算产品和方案亮相WAIC 2024

7月4日，2024世界人工智能大会（WAIC2024）在上海开幕。大会聚焦大模型、算力、机器人、自动驾驶等重点领域，吸引众多国内外知名人工智能企业参会。作为全球领先的IT基础设施供应商，浪潮信息参加

发表于 07-05 18:04 •1466次阅读

浪潮信息重磅发布“源2.0-M32”开源大模型

浪潮信息近日发布了一款全新的开源大模型——“源2.0-M32”。这款大

发表于 06-05 14:50 •767次阅读

浪潮信息发布“源2.0-M32”开源大模型

浪潮信息近日推出了革命性的“源2.0-M32”开源大模型。该模型在

发表于 05-29 09:08 •634次阅读

浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列

近日，浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列。该系列依托浪潮信息自研分布式文件系统，搭载新一代数据加速引擎DataTurbo，

发表于 05-08 09:38 •551次阅读

<b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>为大<b class='flag-5'>模型</b>专门优化的分布式全闪存储AS13000G7-N系列

浪潮信息发布企业大模型开发平台"元脑企智"EPAI，加速AI创新落地

北京2024年4月18日 /美通社/ -- 4月17日，在2024浪潮信息生态伙伴大会（IPF2024）上，浪潮信息发布企业大模型开发平台"元脑企智"EPAI（Enterprise P

发表于 04-18 21:21 •457次阅读

<b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>企业大<b class='flag-5'>模型</b>开发平台"元脑企智"EPAI，加速AI创新落地

浪潮信息发布企业大模型开发平台“元脑企智”EPAI

4月17日，在2024浪潮信息生态伙伴大会（IPF2024）上，浪潮信息重磅发布企业大模型开发平台“元脑企智”EPAI（Enterprise Platform of AI），为企业AI

发表于 04-18 10:12 •380次阅读

<b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>企业大<b class='flag-5'>模型</b>开发平台“元脑企智”EPAI

浪潮信息"源2.0"大模型YuanChat支持英特尔最新商用AI PC

北京2024年3月27日 /美通社/ -- 3月26日， 浪潮信息与英特尔正式宣布，浪潮信息"源2.0系列基础大模型"已和最新的英特尔® 酷

发表于 03-27 22:52 •492次阅读

<b class='flag-5'>浪潮信息</b>"<b class='flag-5'>源</b><b class='flag-5'>2.0</b>"大<b class='flag-5'>模型</b>YuanChat支持英特尔最新商用AI PC

浪潮信息与英特尔合作推出一种大模型效率工具“YuanChat”

3月26日，浪潮信息与英特尔正式宣布，浪潮信息“源2.0系列基础大模型”已和最新的英特尔® 酷睿™ Ultra处理器平台完成适配，本地推理速

发表于 03-27 13:50 •621次阅读

<b class='flag-5'>浪潮信息</b>与英特尔合作推出一种大<b class='flag-5'>模型</b><b class='flag-5'>效率</b>工具“YuanChat”

潞晨科技Colossal-AI与浪潮信息AIStation完成兼容性互认证

近日，潞晨科技的Colossal-AI大模型开发工具和浪潮信息的AIStation智能业务创新生产平台成功完成了兼容性互认证。这一合作意味着用户可以在AIStation平台上便捷地部署与调度Colossal-AI系统，从而极大提升

发表于 03-06 10:18 •792次阅读

潞晨科技Colossal-AI + 浪潮信息AIStation，大模型开发效率提升10倍

北京2024年2月29日 /美通社/ -- 近日，潞晨科技Colossal-AI大模型开发工具与浪潮信息AIStation智能业务创新生产平台完成兼容性互认证。基于AIStation平台部署与调度

发表于 03-01 09:43 •480次阅读

搜索历史

浪潮信息发布源2.0-M32开源大模型，模算效率大幅提升

评论