0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮信息发布源2.0-M32开源大模型,模算效率大幅提升

浪潮AIHPC 来源:浪潮AIHPC 2024-05-29 09:34 次阅读

5月28日,浪潮信息发布“源2.0-M32”开源大模型。“源2.0-M32”在基于”源2.0”系列大模型已有工作基础上,创新性地提出和采用了“基于注意力机制的门控网络”技术,构建包含32个专家(Expert)的混合专家模型(MoE),并大幅提升了模型算力效率,模型运行时激活参数37亿,在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。

算法层面源2.0-M32提出并采用了一种新型的算法结构:基于注意力机制的门控网络(Attention Router),针对MoE模型核心的专家调度策略,这种新的算法结构关注专家模型之间的协同性度量,有效解决传统门控网络下,选择两个或多个专家参与计算时关联性缺失的问题,使得专家之间协同处理数据的水平大为提升。源2.0-M32采用源2.0-2B为基础模型设计,沿用并融合局部过滤增强的注意力机制(LFA, Localized Filtering-based Attention),通过先学习相邻词之间的关联性,然后再计算全局关联性的方法,能够更好地学习到自然语言的局部和全局的语言特征,对于自然语言的关联语义理解更准确,进而提升了模型精度。

9ad71f44-1cea-11ef-b74b-92fbcf53809c.png

Figure1基于注意力机制的门控网络(Attention Router)

■ 数据层面,源2.0-M32基于2万亿的token进行训练、覆盖万亿量级的代码、中英文书籍、百科、论文及合成数据。大幅扩展代码数据占比至47.5%,从6类最流行的代码扩充至619类,并通过对代码中英文注释的翻译,将中文代码数据量增大至1800亿token。结合高效的数据清洗流程,满足大模型训练“丰富性、全面性、高质量”的数据集需求。基于这些数据的整合和扩展,源2.0-M32在代码生成、代码理解、代码推理、数学求解等方面有着出色的表现。

■ 算力层面,源2.0-M32采用了非均匀流水并行的方法,综合运用流水线并行+数据并行的策略,显著降低了大模型对芯片间P2P带宽的需求,为硬件差异较大训练环境提供了一种高性能的训练方法。针对MoE模型的稀疏专家计算,采用合并矩阵乘法的方法,模算效率得到大幅提升。

基于在算法、数据和算力方面全面创新,源2.0-M32的性能得以大幅提升,在多个业界主流的评测任务中,展示出了较为先进的能力表现,在MATH(数学竞赛)、ARC-C(科学推理)榜单上超越了拥有700亿参数的LLaMA3大模型

9b0363c4-1cea-11ef-b74b-92fbcf53809c.jpg

Figure2 源2.0-M32业界主流评测任务表现

源2.0-M32大幅提升了模型算力效率,在实现与业界领先开源大模型性能相当的同时,显著降低了在模型训练、微调和推理所需的算力开销。在模型推理运行阶段,M32处理每token所需算力为7.4GFLOPs,而LLaMA3-70B所需算力为140GFLOPs。在模型微调训练阶段,对1万条平均长度为1024 token的样本进行全量微调,M32消耗算力约0.0026PD(PetaFLOPs/s-day),而LLaMA3消耗算力约为0.05PD。M32凭借特别优化设计的模型架构,在仅激活37亿参数的情况下,取得了和700亿参数LLaMA3相当的性能水平,而所消耗算力仅为LLaMA3的1/19,从而实现了更高的模算效率。

浪潮信息人工智能首席科学家吴韶华表示:当前业界大模型在性能不断提升的同时,也面临着所消耗算力大幅攀升的问题,对企业落地应用大模型带来了极大的困难和挑战。源2.0-M32是浪潮信息在大模型领域持续耕耘的最新探索成果,通过在算法、数据、算力等方面的全面创新,M32不仅可以提供与业界领先开源大模型相当的性能,更可以大幅降低大模型所需算力消耗。大幅提升的模算效率将为企业开发应用生成式AI提供模型高性能、算力低门槛的高效路径。M32开源大模型配合企业大模型开发平台EPAI(Enterprise Platform of AI),将助力企业实现更快的技术迭代与高效的应用落地,为人工智能产业的发展提供坚实的底座和成长的土壤,加速产业智能化进程。


审核编辑:刘清
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    47135

    浏览量

    238113
  • 大模型
    +关注

    关注

    2

    文章

    2406

    浏览量

    2621
  • 生成式AI
    +关注

    关注

    0

    文章

    499

    浏览量

    470

原文标题:浪潮信息发布源2.0-M32开源大模型,模算效率大幅提升,37亿激活参数性能对标LLaMA3-700亿

文章出处:【微信号:浪潮AIHPC,微信公众号:浪潮AIHPC】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    浪潮信息发布”Yuan-EB助力RAG检索精度新高

    近日,浪潮信息发布”Yuan-EB(Yuan-embedding-1.0,嵌入模型),在C-MTEB榜单中斩获检索任务第一名,以78.41的平均精度刷新大
    的头像 发表于 11-26 13:54 165次阅读
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>“<b class='flag-5'>源</b>”Yuan-EB助力RAG检索精度新高

    浪潮信息发布KOS AI定制版,大幅提升模型训练效率

    浪潮信息近期推出了“元脑服务器操作系统KOS AI定制版”,为人工智能领域带来了革命性的变化。这款定制版操作系统通过简单的两步操作,即可实现大模型训练环境的快速部署。
    的头像 发表于 10-30 17:23 498次阅读

    浪潮信息源2.0模型与百度PaddleNLP全面适配

    近日,浪潮信息宣布其开源模型2.0已全面适配百度PaddleNLP。这一举措标志着大模型开发
    的头像 发表于 10-17 18:15 507次阅读

    浪潮信息:元脑企智EPAI助力金融大模型快速落地

    浪潮信息在AI力底座建设、大模型开发领域积累的成熟、成功经验工具化,助力金融机构又快、又稳地部署生成式AI应用,助力金融数智化跨越式发展。
    的头像 发表于 09-20 16:07 335次阅读
    <b class='flag-5'>浪潮信息</b>:元脑企智EPAI助力金融大<b class='flag-5'>模型</b>快速落地

    2.0-M32模型发布量化版 运行显存仅需23GB 性能可媲美LLaMA3

    北京2024年8月23日 /美通社/ -- 近日,浪潮信息发布2.0-M32模型4bit和8bit量化版,性能比肩700亿参数的LLaM
    的头像 发表于 08-25 22:06 293次阅读
    <b class='flag-5'>源</b><b class='flag-5'>2.0-M32</b>大<b class='flag-5'>模型</b><b class='flag-5'>发布</b>量化版 运行显存仅需23GB 性能可媲美LLaMA3

    浪潮信息携全栈智产品和方案亮相WAIC 2024

    7月4日,2024世界人工智能大会(WAIC2024)在上海开幕。大会聚焦大模型力、机器人、自动驾驶等重点领域,吸引众多国内外知名人工智能企业参会。作为全球领先的IT基础设施供应商,浪潮信息参加
    的头像 发表于 07-05 18:04 1466次阅读

    浪潮信息重磅发布2.0-M32开源模型

    浪潮信息近日发布了一款全新的开源模型——“2.0-M32”。这款大
    的头像 发表于 06-05 14:50 767次阅读

    浪潮信息发布2.0-M32开源模型

    浪潮信息近日推出了革命性的“2.0-M32开源模型。该模型
    的头像 发表于 05-29 09:08 634次阅读

    浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列

    近日,浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列。该系列依托浪潮信息自研分布式文件系统,搭载新一代数据加速引擎DataTurbo,
    的头像 发表于 05-08 09:38 551次阅读
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>为大<b class='flag-5'>模型</b>专门优化的分布式全闪存储AS13000G7-N系列

    浪潮信息发布企业大模型开发平台&quot;元脑企智&quot;EPAI,加速AI创新落地

    北京2024年4月18日 /美通社/ -- 4月17日,在2024浪潮信息生态伙伴大会(IPF2024)上,浪潮信息发布企业大模型开发平台"元脑企智"EPAI(Enterprise P
    的头像 发表于 04-18 21:21 457次阅读
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>企业大<b class='flag-5'>模型</b>开发平台&quot;元脑企智&quot;EPAI,加速AI创新落地

    浪潮信息发布企业大模型开发平台“元脑企智”EPAI

    4月17日,在2024浪潮信息生态伙伴大会(IPF2024)上,浪潮信息重磅发布企业大模型开发平台“元脑企智”EPAI(Enterprise Platform of AI),为企业AI
    的头像 发表于 04-18 10:12 380次阅读
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>企业大<b class='flag-5'>模型</b>开发平台“元脑企智”EPAI

    浪潮信息&quot;2.0&quot;大模型YuanChat支持英特尔最新商用AI PC

    北京2024年3月27日 /美通社/ -- 3月26日, 浪潮信息与英特尔正式宣布,浪潮信息"2.0系列基础大模型"已和最新的英特尔® 酷
    的头像 发表于 03-27 22:52 492次阅读
    <b class='flag-5'>浪潮信息</b>&quot;<b class='flag-5'>源</b><b class='flag-5'>2.0</b>&quot;大<b class='flag-5'>模型</b>YuanChat支持英特尔最新商用AI PC

    浪潮信息与英特尔合作推出一种大模型效率工具“YuanChat”

    3月26日,浪潮信息与英特尔正式宣布,浪潮信息2.0系列基础大模型”已和最新的英特尔® 酷睿™ Ultra处理器平台完成适配,本地推理速
    的头像 发表于 03-27 13:50 621次阅读
    <b class='flag-5'>浪潮信息</b>与英特尔合作推出一种大<b class='flag-5'>模型</b><b class='flag-5'>效率</b>工具“YuanChat”

    潞晨科技Colossal-AI与浪潮信息AIStation完成兼容性互认证

    近日,潞晨科技的Colossal-AI大模型开发工具和浪潮信息的AIStation智能业务创新生产平台成功完成了兼容性互认证。这一合作意味着用户可以在AIStation平台上便捷地部署与调度Colossal-AI系统,从而极大提升
    的头像 发表于 03-06 10:18 792次阅读

    潞晨科技Colossal-AI + 浪潮信息AIStation,大模型开发效率提升10倍

    北京2024年2月29日 /美通社/ -- 近日,潞晨科技Colossal-AI大模型开发工具与浪潮信息AIStation智能业务创新生产平台完成兼容性互认证。基于AIStation平台部署与调度
    的头像 发表于 03-01 09:43 480次阅读
    潞晨科技Colossal-AI + <b class='flag-5'>浪潮信息</b>AIStation,大<b class='flag-5'>模型</b>开发<b class='flag-5'>效率</b><b class='flag-5'>提升</b>10倍