浪潮信息发布源2.0基础大模型，千亿参数全面开源-电子发烧友网

11月27日，浪潮信息发布"源2.0"基础大模型，并宣布全面开源。源2.0基础大模型包括1026亿、518亿、21亿等三种参数规模的模型，在编程、推理、逻辑等方面展示出了先进的能力。

当前，大模型技术正在推动生成式人工智能产业迅猛发展，而基础大模型的关键能力则是大模型在行业和应用落地能力表现的核心支撑，但基础大模型的发展也面临着在算法、数据和算力等方面的诸多挑战。源2.0基础大模型则针对性地提出了新的改进方法并获得了能力的提升。

算法方面，源2.0提出并采用了一种新型的注意力算法结构：局部注意力过滤增强机制(LFA：Localized Filtering-based Attention)。LFA通过先学习相邻词之间的关联性，然后再计算全局关联性的方法，能够更好地学习到自然语言的局部和全局的语言特征，对于自然语言的关联语义理解更准确、更人性，提升了模型的自然语言表达能力，进而提升了模型精度。

数据方面，源2.0通过使用中英文书籍、百科、论文等高质量中英文资料，降低了互联网语料内容占比，结合高效的数据清洗流程，为大模型训练提供了高质量的专业数据集和逻辑推理数据集。为了获取中文数学数据，我们清洗了从2018年至今约12PB的互联网数据，但仅获取到了约10GB的数学数据，投入巨大，收益较小。为了更高效地获得相对匮乏的高质量中文数学及代码数据集，源2.0采用了基于大模型的数据生产及过滤方法，在保证数据的多样性的同时也在每一个类别上提升数据质量，获取了一批高质量的数学与代码预训练数据。

算力方面，源2.0采用了非均匀流水并行的方法，综合运用流水线并行+优化器参数并行+数据并行的策略，让模型在流水并行各阶段的显存占用量分布更均衡，避免出现显存瓶颈导致的训练效率降低的问题，该方法显著降低了大模型对芯片间P2P带宽的需求，为硬件差异较大训练环境提供了一种高性能的训练方法。

源2.0作为千亿级基础大模型，在业界公开的评测上进行了代码生成、数学问题求解、事实问答方面的能力测试，测试结果显示，源2.0在多项模型评测中，展示出了较为先进的能力表现。

源2.0采用全面开源策略，全系列模型参数和代码均可免费下载使用。

审核编辑：汤梓红

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

半导体

半导体

+关注

关注
334

文章
27616

浏览量
221007
浪潮

浪潮

+关注

关注
1

文章
465

浏览量
23911
大模型

大模型

+关注

关注
2

文章
2519

浏览量
2972

浪潮信息与智源研究院携手共建大模型多元算力生态

近日，浪潮信息与北京智源人工智能研究院正式签署战略合作协议，双方将紧密合作，共同构建大模型多元算力开源创新生态。此次合作旨在提升大模型创新

发表于 12-31 11:49 •267次阅读

浪潮信息与智源研究院达成战略合作协议

近日，浪潮信息与智源研究院达成战略合作协议，双方将紧密协作共建大模型多元算力开源创新生态，提升大模型创新研发的算力效率，降低大

发表于 12-26 10:25 •203次阅读

浪潮信息发布"源"Yuan-EB，刷新RAG检索最高成绩

近日，浪潮信息在AI领域取得了重大突破，成功发布了其嵌入模型"源"Yuan-EB(Yuan-embedding-1.0)。在备受瞩目的C-MTEB榜单中，"

发表于 12-25 15:54 •171次阅读

浪潮信息发布“源”Yuan-EB助力RAG检索精度新高

近日，浪潮信息发布 “源”Yuan-EB（Yuan-embedding-1.0，嵌入模型），在C-MTEB榜单中斩获检索任务第一名，以78.41的平均精度刷新大

发表于 11-26 13:54 •218次阅读

<b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>“<b class='flag-5'>源</b>”Yuan-EB助力RAG检索精度新高

浪潮信息源2.0大模型与百度PaddleNLP全面适配

近日，浪潮信息宣布其开源大模型源2.0已全面适配百度PaddleNLP。这一举措标志着大

发表于 10-17 18:15 •548次阅读

浪潮信息发布AIStation V5，全面支持大模型开发流程与高效算力调度

北京2024年7月11日 /美通社/ -- 7月9日，在"元脑中国行"全国巡展济南站上，浪潮信息发布AIStation 人工智能开发平台V5升级版，具备全面的大模型流程支持能力，帮助企

发表于 07-12 09:37 •427次阅读

<b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>AIStation V5，<b class='flag-5'>全面</b>支持大<b class='flag-5'>模型</b>开发流程与高效算力调度

浪潮信息重磅发布“源2.0-M32”开源大模型

浪潮信息近日发布了一款全新的开源大模型——“源2.0-M32”。这款大

发表于 06-05 14:50 •818次阅读

浪潮信息发布源2.0-M32开源大模型，模算效率大幅提升

5月28日，浪潮信息发布“源2.0-M32”开源大模型。“源

发表于 05-29 09:34 •468次阅读

浪潮信息发布“源2.0-M32”开源大模型

浪潮信息近日推出了革命性的“源2.0-M32”开源大模型。该模型在

发表于 05-29 09:08 •697次阅读

为大模型专门优化 浪潮信息发布分布式全闪存储AS13000G7-N系列

北京2024年5月10日 /美通社/ -- 近日，浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列。该系列依托浪潮信息自研分布式文件系统，搭载新一代数据加速引擎

发表于 05-10 16:37 •458次阅读

浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列

近日，浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列。该系列依托浪潮信息自研分布式文件系统，搭载新一代数据加速引擎DataTurbo，

发表于 05-08 09:38 •589次阅读

浪潮信息“元脑”品牌全面升级，全力进击人工智能！

在北京举行的浪潮信息生态伙伴大会(IPF2024)上，浪潮信息总经理胡雷钧表示，未来，一切计算皆AI，“元脑”全面升级为包括所有计算产品的智算品牌，同时“元脑”也是生态品牌。

发表于 04-19 10:42 •657次阅读

浪潮信息发布企业大模型开发平台“元脑企智”EPAI

4月17日，在2024浪潮信息生态伙伴大会（IPF2024）上，浪潮信息重磅发布企业大模型开发平台“元脑企智”EPAI（Enterprise Platform of AI），为企业AI

发表于 04-18 10:12 •414次阅读

浪潮信息"源2.0"大模型YuanChat支持英特尔最新商用AI PC

北京2024年3月27日 /美通社/ -- 3月26日， 浪潮信息与英特尔正式宣布，浪潮信息"源2.0系列基础大模型"已和最新的英特尔® 酷

发表于 03-27 22:52 •546次阅读

浪潮信息与英特尔合作推出一种大模型效率工具“YuanChat”

3月26日，浪潮信息与英特尔正式宣布，浪潮信息“源2.0系列基础大模型”已和最新的英特尔® 酷睿™ Ultra处理器平台完成适配，本地推理速

发表于 03-27 13:50 •673次阅读