0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

天数智芯支持智源研究院首次完成大模型异构算力混合训练,突破异构算力束缚

天数智芯 来源:未知 2023-11-30 13:10 次阅读
1129日,北京智源人工智能研究院副院长兼总工程师林咏华在2023人工智能计算大会上宣布,正式开源700亿参数大模型Aquila2-70B-Expr(异构先驱版),这是首个基于英伟达混合资源及天数智芯混合资源完成训练的大模型,也是智源研究院与天数智芯合作取得的最新成果,再次证明了天数智芯通用GPU产品支持大模型训练的能力,以及与主流产品的兼容能力。wKgaomVoGlaAU6VuAADdsa8E_Yk828.jpg据林咏华副院长介绍,为了解决异构算力混合训练难题,智源研究院开发了高效并行训练框架FlagScale,支持异构算力混合训练,并在10月开源了FlagScale v0.1版本。此次基于FlagScale v0.2分别在英伟达混合资源(A100集群+A800集群)、天数智芯混合资源(BI-V100集群+BI-V150集群)完成了Aquila2-70B-Expr大模型训练工作。

wKgaomVoGlaAM9NnAAGPG4g0hWQ725.jpg天数智芯在今年上半年搭建了天垓100BI-V100)算力集群支持智源研究院开展70亿参数大模型训练。在此基础上,双方进一步深化合作。天数智芯首先搭建了128节点的BI-V100集群环境,支持智源研究院开展Aquila2-70B-Expr完整训练。训练到20万步,导出模型并完成总计11项性能指标的评估,涉及常识推断、多任务语言理解、真实性回答等场景,将基线实验和对比实验送到真实数据集上进行评测,计算差异在0.28%在精度上与国际主流集群训练的权重文件水平相当。同时,天数智芯基于新一代产品天垓150BI-V150)搭建了16节点集群环境,用于智源研究院混合并行训练研究。智源研究院利用120节点BI-V100集群加上8节点BI-V150集群进行Aquila2-70B-Expr大模型混合训练,混合集群性能达到上界(理想合池理论峰值)的85.3%测试结果显示,在天数智芯产品上异构训练,对模型性能影响甚微。

这一成果极具商业价值和应用前景,有助于解决智算中心换代升级、增容后新旧计算卡并用难题,为智算中心高效运行提供了新方案。 wKgaomVoGlaAJ-_XAAAlV2YGdhE627.gifEND


原文标题:天数智芯支持智源研究院首次完成大模型异构算力混合训练,突破异构算力束缚

文章出处:【微信公众号:天数智芯】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 天数智芯
    +关注

    关注

    0

    文章

    95

    浏览量

    5545

原文标题:天数智芯支持智源研究院首次完成大模型异构算力混合训练,突破异构算力束缚

文章出处:【微信号:IluvatarCoreX,微信公众号:天数智芯】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    浪潮信息与智研究院达成战略合作协议

    近日,浪潮信息与智研究院达成战略合作协议,双方将紧密协作共建大模型多元开源创新生态,提升大模型
    的头像 发表于 12-26 10:25 104次阅读

    合”异构混合并行训练系统1.0发布

    近日,中国移动研究院副院长段晓东携手天数、壁仞科技、中兴、海光、瀚博等一众产业合作伙伴,共同推出了“合”异构
    的头像 发表于 12-13 15:46 163次阅读

    壁仞科技联合中国电信等合作伙伴共同发布智异构混训解决方案

    工智能实验室等发布了“智异构混训解决方案”,打造、网络、平台、通信库、框架全栈异构方案
    的头像 发表于 12-07 17:56 963次阅读

    澎峰科技助力中国移动发布智合”原生基础软件栈2.0

    近日 ,由中国通信学会主办、中国移动研究院承办的2024中国信息通信大会“网络网一体创新发展论坛 ”在成都召开。中国移动研究院携手澎峰
    的头像 发表于 12-03 13:29 242次阅读

    成为产业发展方阵会员单位

    近日,由中国信息通信研究院(以下简称“信通”)牵头成立的产业发展方阵在合肥市成功召开第一次工作组全会,
    的头像 发表于 11-04 09:34 256次阅读

    中国智能汽车腾飞,为什么异构是第一生产

    智能时代的“世纪之车”,异构是第一驱动力
    的头像 发表于 09-14 10:32 3709次阅读
    中国智能汽车腾飞,为什么<b class='flag-5'>异构</b><b class='flag-5'>算</b><b class='flag-5'>力</b>是第一生产<b class='flag-5'>力</b>?

    模型时代的需求

    现在AI已进入大模型时代,各企业都争相部署大模型,但如何保证大模型,以及相关的稳定性和性能,是一个极为重要的问题,带着这个极为重要的问
    发表于 08-20 09:04

    安谋科技异构组合,破局生成式AI挑战

    ,“此P1”不仅异构集成了Armv9 CPU核心与Arm Immortalis GPU,还搭载了安谋科技(中国)有限公司(以下简称“安谋科技”)“周易”NPU等自研业务产品。凭借高能效的异构
    的头像 发表于 08-13 09:12 570次阅读

    安谋科技异构赋能AI计算,此科技首款AI PC芯片发布

    底座,“此P1”不仅异构集成了Arm®v9 CPU核心与Arm Immortalis™ GPU,还搭载了安谋科技(中国)有限公司(以下简称“安谋科技”)“周易”NPU等自研业务产品。凭借高能效的异构
    发表于 07-31 14:36 1040次阅读
    安谋科技<b class='flag-5'>异构</b><b class='flag-5'>算</b><b class='flag-5'>力</b>赋能AI计算,此<b class='flag-5'>芯</b>科技首款AI PC芯片发布

    中国中心市场持续增长,智能规模快速崛起

    7月24日,中国信息通信研究院(简称“中国信通”)权威发布了《中国中心服务商分析报告(2024年)》,该报告深入剖析了中国
    的头像 发表于 07-24 15:25 468次阅读

    神州鲲泰亮相北京数字安全大会,以智能构筑数据安全的坚实底座

    GPU资源虚拟化或池化,完成跨集群之间的调度;打造异构加速平台HICA,屏蔽集群内底层
    的头像 发表于 07-18 16:06 443次阅读
    神州鲲泰亮相北京数字安全大会,以智能<b class='flag-5'>算</b><b class='flag-5'>力</b>构筑数据安全的坚实底座

    异构混训整合不同架构芯片资源,提高利用率

    电子发烧友网报道(文/李弯弯)随着AI技术的飞速发展,大模型训练和推理任务对的需求日益增长。然而,单一品牌的芯片往往难以满足所有需求,且可能存在供应链风险。因此,
    的头像 发表于 07-18 00:11 3462次阅读

    鲲泰新闻|神州鲲泰创新智之旅北京站开幕,发布全新智架构和液冷整机柜产品应对 “多云、异构、绿色

    5月17日,神州鲲泰智中国行北京站盛大召开。在本次活动上,神州鲲泰针对用户对大模型训练、大需求的痛点,重磅发布多云
    的头像 发表于 05-22 10:56 377次阅读
    鲲泰新闻|神州鲲泰创新智<b class='flag-5'>算</b>之旅北京站开幕,发布全新智<b class='flag-5'>算</b>架构和液冷整机柜产品应对 “多云、<b class='flag-5'>异构</b>、绿色

    全志科技T527高八核异构芯片获“年度最佳SoC”荣誉

    全志科技T527高八核异构芯片获“年度最佳SoC”荣誉
    的头像 发表于 04-08 10:29 1642次阅读
    全志科技T527高<b class='flag-5'>算</b><b class='flag-5'>力</b>八核<b class='flag-5'>异构</b>芯片获“年度最佳SoC”荣誉

    大茉莉X16-P,5800M大称王称霸

    Rykj365
    发布于 :2024年01月25日 14:54:52