0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

摩尔线程率先完成对“悟道·天鹰”大模型的推理兼容适配

摩尔线程 来源:摩尔线程 2023-06-12 14:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

6月,智源研究院在北京智源大会上重磅发布了全面开源的“悟道3.0”系列大模型,包括“悟道·天鹰”(Aquila)语言大模型等领先成果。目前,摩尔线程已率先完成对“悟道·天鹰”(Aquila)大模型的推理兼容适配,整个适配过程仅花费不到6小时时间,便实现与摩尔线程自研MUSAChat应用的无缝集成。此前,摩尔线程曾在ChatGLM发布后24小时内实现适配,并在数小时内适配LLaMA模型,摩尔线程CUDA兼容的技术能力一再被验证。

这充分得益于摩尔线程强大的代码移植工具"MUSIFY"。该工具可快速将现有的CUDA程序迁移至摩尔线程MUSA,零成本完成CUDA代码自动移植,之后用户短时间内即可完成热点分析和针对性优化,大大缩短迁移优化的周期,从而使得大模型适配形成了标准“流水线作业”,让开发者可以省时、省力、省事、省心。

目前,基于摩尔线程打造的AI云计算平台,已经可以运行ChatGLM、Stable Diffusion、LLaMA、“悟道3.0”等开源大模型,以及摩尔线程自研的MUSAChat和MUSABert等模型的部分训练和推理应用。借助摩尔线程元计算统一系统架构MUSA,用户可以复用PyTorch开源社区的大量模型算子,降低开发成本。与此同时,摩尔线程开源的MT Pytorch可以支持多种模型的推理,覆盖CV、NLP、语音等多个领域,能够运行典型的大模型分布式多卡推理,也可以支持单机多卡与多机多卡的分布式训练。利用数据并行、模型并行以及ZERO等分布式训练技术,MT PyTorch还可以完成简单基础模型以及典型Transformer结构的NLP语言模型的训练。

据悉,智源此次发布的“悟道3.0”系列开源模型涵盖语言、视觉、多模态等基础大模型,其中,“悟道·天鹰”(Aquila)语言大模型是首个具备中英双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型。其在中英文高质量语料基础上从0开始训练,通过数据质量的控制、多种训练的优化方法,实现在更小的数据集、更短的训练时间内,获得比其他开源模型更优的性能。

“悟道・天鹰(Aquila)”语言大模型开源商用许可无疑将会成为自主大语言模型产业生态的一个里程碑事件。摩尔线程也愿与众多优秀的基础模型供应商深度合作,携手从硬件、算子、算法多个方面进行深度优化,从硬件、软件、模型、业务多个维度赋能应用开发商,致力于让大模型更好赋能千行百业。
责任编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7348

    浏览量

    95016
  • 模型
    +关注

    关注

    1

    文章

    3818

    浏览量

    52265
  • 摩尔线程
    +关注

    关注

    2

    文章

    285

    浏览量

    6658

原文标题:“悟道·天鹰”(Aquila)发布24小时后,摩尔线程率先实现兼容适配

文章出处:【微信号:moorethreads,微信公众号:摩尔线程】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    海光信息DCU平台完成对DeepSeek V4模型极速适配

      4月24日,深度求索正式发布并开源DeepSeek V4。海光DCU同步完成对DeepSeek V4的Day0适配,以“模型发布—芯片适配—产业落地”的高效闭环,为全球开发者、企业
    的头像 发表于 04-24 17:32 296次阅读

    MiniMax M2.7全球开源,摩尔线程、沐曦等完成Day0适配

    厂商、推理平台已完成Day0适配,即在开源首日已经完成模型接入与推理
    的头像 发表于 04-14 11:05 1706次阅读

    昆仑芯科技完成MiniMax M2.7模型极速适配

    今日,MiniMax正式开源MiniMax M2.7模型。昆仑芯同步完成对模型的Day 0适配与深度优化,成为首批实现适配的国产算力厂商之
    的头像 发表于 04-13 17:07 473次阅读

    Day-0支持|摩尔线程率先完成MiniMax M2.7大模型适配

    4月12日,摩尔线程旗舰级AI训推一体全功能GPU MTT S5000已完成对新一代大模型MiniMax M2.7的Day-0极速适配,再次
    发表于 04-13 07:57 1265次阅读
    Day-0支持|<b class='flag-5'>摩尔</b><b class='flag-5'>线程</b><b class='flag-5'>率先</b><b class='flag-5'>完成</b>MiniMax M2.7大<b class='flag-5'>模型</b><b class='flag-5'>适配</b>

    Day-0支持|摩尔线程完成智谱GLM-5.1极速适配,高效支撑长程任务与代码生成

      今日,摩尔线程在其旗舰级AI训推一体全功能GPU MTT S5000上,成功实现了对智谱新一代旗舰模型GLM-5.1的Day-0极速适配,提供
    的头像 发表于 04-08 14:47 1040次阅读
    Day-0支持|<b class='flag-5'>摩尔</b><b class='flag-5'>线程</b><b class='flag-5'>完成</b>智谱GLM-5.1极速<b class='flag-5'>适配</b>,高效支撑长程任务与代码生成

    海光DCU完成阶跃星辰基座模型Step 3.5 Flash推理适配

    近日,海光DCU正式完成对阶跃星辰旗舰开源基座模型Step 3.5 Flash的全流程适配与深度调优。得益于新一代海光DCU原生支持FP8精度、超越主流旗舰产品的更大显存等核心优势,高效完成
    的头像 发表于 03-26 09:48 636次阅读

    摩尔线程MTT S5000全面适配Qwen3.5三款新模型

    第一时间做出极速响应,宣布已在旗舰级AI训推一体全功能GPU MTT S5000上,完成对这三款全新模型的全方位适配。   此次高效支持充分展示了摩尔
    的头像 发表于 02-26 16:23 756次阅读

    摩尔线程快速完成对Qwen3.5模型全面适配

    2月17日,摩尔线程宣布已在旗舰级AI训推一体全功能GPU MTT S5000上完成对阿里最新大模型Qwen3.5的全方位适配。此次支持充分
    发表于 02-18 08:32 1118次阅读

    Day-0支持|摩尔线程完成MiniMax M2.5模型极速适配

    2月14日,摩尔线程在其旗舰级AI训推一体全功能GPU MTT S5000上,成功实现了对MiniMax新一代大模型MiniMax M2.5的Day-0极速适配。 在此次
    发表于 02-15 08:01 1585次阅读

    摩尔线程MTT S5000率先完成对GLM-5的适配

    2月11日,智谱正式发布新一代大模型GLM-5。摩尔线程基于SGLang推理框架,在旗舰级AI训推一体全功能GPU MTT S5000上,Day-0
    的头像 发表于 02-12 10:34 973次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>MTT S5000<b class='flag-5'>率先</b><b class='flag-5'>完成对</b>GLM-5的<b class='flag-5'>适配</b>

    Day-0支持|摩尔线程MTT S5000率先完成对GLM-5的适配

    2月11日,智谱正式发布新一代大模型GLM-5。摩尔线程基于SGLang推理框架,在旗舰级AI训推一体全功能GPU MTT S5000上,Day-0
    发表于 02-12 09:15 1611次阅读
    Day-0支持|<b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>MTT S5000<b class='flag-5'>率先</b><b class='flag-5'>完成对</b>GLM-5的<b class='flag-5'>适配</b>

    澎峰科技完成OpenAI最新开源推理模型适配

    澎峰科技现已完成 OpenAI 最新开源推理模型 gpt-oss-20b 在 DeepFusion 大模型一体机上的原生适配与优化,用户可一键启用这颗“小而强悍”的新引擎,在本地享受企
    的头像 发表于 08-14 11:34 1547次阅读

    摩尔线程率先支持腾讯混元-A13B模型

    近日,腾讯正式开源基于专家混合(MoE)架构的大语言模型混元-A13B。同日,摩尔线程团队凭借技术前瞻性,率先完成
    的头像 发表于 07-04 14:10 1005次阅读

    壁仞科技完成Qwen3旗舰模型适配

    近日,在高效适配Qwen3系列模型推理后,壁仞科技宣布完成旗舰版Qwen3-235B-A22B模型的训练
    的头像 发表于 05-16 16:23 1164次阅读

    摩尔线程GPU率先支持Qwen3全系列模型

    近日,阿里云正式发布Qwen3系列的8款开源混合推理模型摩尔线程团队在模型发布当天,率先完成
    的头像 发表于 05-07 15:24 1132次阅读