0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮信息发布源2.0基础大模型,千亿参数全面开源

全球TMT 来源:全球TMT 作者:全球TMT 2023-11-28 09:10 次阅读

11月27日,浪潮信息发布"源2.0"基础大模型,并宣布全面开源。源2.0基础大模型包括1026亿、518亿、21亿等三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。

当前,大模型技术正在推动生成式人工智能产业迅猛发展,而基础大模型的关键能力则是大模型在行业和应用落地能力表现的核心支撑,但基础大模型的发展也面临着在算法、数据和算力等方面的诸多挑战。源2.0基础大模型则针对性地提出了新的改进方法并获得了能力的提升。

算法方面,源2.0提出并采用了一种新型的注意力算法结构:局部注意力过滤增强机制(LFA:Localized Filtering-based Attention)。LFA通过先学习相邻词之间的关联性,然后再计算全局关联性的方法,能够更好地学习到自然语言的局部和全局的语言特征,对于自然语言的关联语义理解更准确、更人性,提升了模型的自然语言表达能力,进而提升了模型精度。

wKgZomVkrZuAFWGyAACX2OTQDsk961.jpg


数据方面,源2.0通过使用中英文书籍、百科、论文等高质量中英文资料,降低了互联网语料内容占比,结合高效的数据清洗流程,为大模型训练提供了高质量的专业数据集和逻辑推理数据集。为了获取中文数学数据,我们清洗了从2018年至今约12PB的互联网数据,但仅获取到了约10GB的数学数据,投入巨大,收益较小。为了更高效地获得相对匮乏的高质量中文数学及代码数据集,源2.0采用了基于大模型的数据生产及过滤方法,在保证数据的多样性的同时也在每一个类别上提升数据质量,获取了一批高质量的数学与代码预训练数据。

wKgaomVkrZuAeYSmAADRtny3Qdk117.jpg


算力方面,源2.0采用了非均匀流水并行的方法,综合运用流水线并行+优化器参数并行+数据并行的策略,让模型在流水并行各阶段的显存占用量分布更均衡,避免出现显存瓶颈导致的训练效率降低的问题,该方法显著降低了大模型对芯片间P2P带宽的需求,为硬件差异较大训练环境提供了一种高性能的训练方法。

wKgaomVlP6mALQxWAAM0Ok9OLqE815.jpg


源2.0作为千亿级基础大模型,在业界公开的评测上进行了代码生成、数学问题求解、事实问答方面的能力测试,测试结果显示,源2.0在多项模型评测中,展示出了较为先进的能力表现。

wKgZomVkrZ6Af_R2AABvvDO94lM918.jpg


源2.0采用全面开源策略,全系列模型参数和代码均可免费下载使用。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 半导体
    +关注

    关注

    334

    文章

    27101

    浏览量

    216890
  • 浪潮
    +关注

    关注

    1

    文章

    455

    浏览量

    23830
  • 大模型
    +关注

    关注

    2

    文章

    2354

    浏览量

    2539
收藏 人收藏

    评论

    相关推荐

    浪潮信息发布”Yuan-EB助力RAG检索精度新高

    近日,浪潮信息发布”Yuan-EB(Yuan-embedding-1.0,嵌入模型),在C-MTEB榜单中斩获检索任务第一名,以78.41的平均精度刷新大
    的头像 发表于 11-26 13:54 137次阅读
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>“<b class='flag-5'>源</b>”Yuan-EB助力RAG检索精度新高

    浪潮信息源2.0模型与百度PaddleNLP全面适配

    近日,浪潮信息宣布其开源模型2.0全面适配百度PaddleNLP。这一举措标志着大
    的头像 发表于 10-17 18:15 479次阅读

    浪潮信息发布AIStation V5,全面支持大模型开发流程与高效算力调度

    北京2024年7月11日 /美通社/ -- 7月9日,在"元脑中国行"全国巡展济南站上,浪潮信息发布AIStation 人工智能开发平台V5升级版,具备全面的大模型流程支持能力,帮助企
    的头像 发表于 07-12 09:37 388次阅读
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>AIStation V5,<b class='flag-5'>全面</b>支持大<b class='flag-5'>模型</b>开发流程与高效算力调度

    浪潮信息推出AIGC存储解决方案

    近日,在科技创新的浪潮中,浪潮信息成功举办了“元脑中国行”全国巡展的杭州站活动,此次盛会不仅汇聚了业界的精英与目光,更见证了浪潮信息在AIGC(人工智能生成内容)领域的一次重大突破。会上,浪潮
    的头像 发表于 07-03 11:16 695次阅读

    浪潮信息重磅发布2.0-M32”开源模型

    浪潮信息近日发布了一款全新的开源模型——“2.0-M32”。这款大
    的头像 发表于 06-05 14:50 748次阅读

    毕昇大模型应用开发平台+浪潮信息AIStation,让大模型定制更简单

    北京2024年6月5日 /美通社/ -- 近日,毕昇大模型应用开发平台与浪潮信息AIStation智能业务生产创新平台完成兼容性互认证。基于毕昇和浪潮信息AIStation,用户通过预置的毕昇助手
    的头像 发表于 06-05 11:58 410次阅读
    毕昇大<b class='flag-5'>模型</b>应用开发平台+<b class='flag-5'>浪潮信息</b>AIStation,让大<b class='flag-5'>模型</b>定制更简单

    浪潮信息发布2.0-M32开源模型,模算效率大幅提升

    5月28日,浪潮信息发布2.0-M32”开源模型。“
    的头像 发表于 05-29 09:34 400次阅读
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b><b class='flag-5'>源</b><b class='flag-5'>2.0</b>-M32<b class='flag-5'>开源</b>大<b class='flag-5'>模型</b>,模算效率大幅提升

    浪潮信息发布2.0-M32”开源模型

    浪潮信息近日推出了革命性的“2.0-M32”开源模型。该模型
    的头像 发表于 05-29 09:08 609次阅读

    浪潮信息发布AS13000G7-N系列分布式全闪存储

    浪潮信息近日推出了专为大型AI模型优化的AS13000G7-N系列分布式全闪存储。该系列基于浪潮信息自研的分布式文件系统,结合新一代数据加速引擎DataTurbo,为用户提供卓越的存储解决方案。
    的头像 发表于 05-14 10:03 527次阅读

    为大模型专门优化 浪潮信息发布分布式全闪存储AS13000G7-N系列

    北京2024年5月10日 /美通社/ -- 近日,浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列。该系列依托浪潮信息自研分布式文件系统,搭载新一代数据加速引擎
    的头像 发表于 05-10 16:37 415次阅读
    为大<b class='flag-5'>模型</b>专门优化 <b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>分布式全闪存储AS13000G7-N系列

    浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列

    近日,浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列。该系列依托浪潮信息自研分布式文件系统,搭载新一代数据加速引擎DataTurbo,
    的头像 发表于 05-08 09:38 518次阅读
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>为大<b class='flag-5'>模型</b>专门优化的分布式全闪存储AS13000G7-N系列

    浪潮信息“元脑”品牌全面升级,全力进击人工智能!

    在北京举行的浪潮信息生态伙伴大会(IPF2024)上,浪潮信息总经理胡雷钧表示,未来,一切计算皆AI,“元脑”全面升级为包括所有计算产品的智算品牌,同时“元脑”也是生态品牌。
    的头像 发表于 04-19 10:42 617次阅读
    <b class='flag-5'>浪潮信息</b>“元脑”品牌<b class='flag-5'>全面</b>升级,全力进击人工智能!

    浪潮信息发布企业大模型开发平台“元脑企智”EPAI

    4月17日,在2024浪潮信息生态伙伴大会(IPF2024)上,浪潮信息重磅发布企业大模型开发平台“元脑企智”EPAI(Enterprise Platform of AI),为企业AI
    的头像 发表于 04-18 10:12 371次阅读
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>企业大<b class='flag-5'>模型</b>开发平台“元脑企智”EPAI

    浪潮信息&quot;2.0&quot;大模型YuanChat支持英特尔最新商用AI PC

    北京2024年3月27日 /美通社/ -- 3月26日, 浪潮信息与英特尔正式宣布,浪潮信息"2.0系列基础大模型"已和最新的英特尔® 酷
    的头像 发表于 03-27 22:52 474次阅读
    <b class='flag-5'>浪潮信息</b>&quot;<b class='flag-5'>源</b><b class='flag-5'>2.0</b>&quot;大<b class='flag-5'>模型</b>YuanChat支持英特尔最新商用AI PC

    浪潮信息与英特尔合作推出一种大模型效率工具“YuanChat”

    3月26日,浪潮信息与英特尔正式宣布,浪潮信息2.0系列基础大模型”已和最新的英特尔® 酷睿™ Ultra处理器平台完成适配,本地推理速
    的头像 发表于 03-27 13:50 599次阅读
    <b class='flag-5'>浪潮信息</b>与英特尔合作推出一种大<b class='flag-5'>模型</b>效率工具“YuanChat”