近日,摩尔线程与北京智源人工智能研究院(简称:智源研究院)已顺利完成基于Triton语言的高性能算子库FlagGems的适配工作。得益于摩尔线程自研统一系统计算架构MUSA,双方在短短一周多的时间里,即成功完成了近60个算子的功能验证,精度符合交付标准,并实现对Bert-large模型的全面支持。FlagGems算子库在摩尔线程MUSA架构上展现出了接近手写算子的计算性能,且性能还在持续调优,极大加速了开源大模型在摩尔线程全功能GPU上的部署速度。
智源研究院在今年的智源大会上推出了FlagGems算子库,这是一个使用Triton编程语言实现的高性能通用算子库,旨在为大语言模型提供一系列可应用于PyTorch框架的算子,加速模型的推理与训练,降低新算法的开发门槛,促进芯片架构的创新。FlagGems算子库以Triton编程语言的易用性和编译器的标准接口为基础,为多元芯片提供了一套易适配、高性能的算子解决方案,推动基于Triton的统一、开源的软硬件生态建设。
在适配过程中,摩尔线程与智源研究院团队紧密合作,共同克服了一系列技术挑战,确保FlagGems算子库在摩尔线程全功能GPU上的高效稳定运行。摩尔线程研发团队经过充分调研论证,还形成了Triton编译器在MUSA架构上适配的完整方案,力求实现开发者在基于摩尔线程全功能GPU进行Triton开发算子过程中,也能获得与原来一致的体验,做到CUDA框架和MUSA框架的无缝迁移。
此次合作不仅充分展示了摩尔线程全功能GPU强大的兼容性、灵活性与扩展性,也为开发者和用户带来了更广泛的选择和更高效的开发体验。摩尔线程和智源研究院将继续深化合作,共同促进AI技术的发展和应用,为中国大模型的发展贡献力量。
关于智源研究院
北京智源人工智能研究院(简称:智源研究院)是北京市于2018年11月推动成立的新型研发机构。智源研究院的核心目标是聚焦人工智能原始创新和核心技术,推动人工智能理论、方法、工具、系统和应用取得变革性、颠覆性突破,支撑北京建设成为全球人工智能学术思想、基础理论、顶尖人才、企业创新和发展政策的源头。
关于摩尔线程
摩尔线程成立于2020年10月,以全功能GPU为核心,致力于向全球提供加速计算的基础设施和一站式解决方案,为各行各业的数智化转型提供强大的AI计算支持。
我们的目标是成为具备国际竞争力的GPU领军企业,为融合人工智能和数字孪生的数智世界打造先进的加速计算平台。我们的愿景是为美好世界加速。
-
开源
+关注
关注
3文章
4348浏览量
46445 -
摩尔线程
+关注
关注
2文章
286浏览量
6663 -
大模型
+关注
关注
2文章
3773浏览量
5273
原文标题:摩尔线程 × 智源研究院|完成基于Triton的大模型算子库适配
文章出处:【微信号:moorethreads,微信公众号:摩尔线程】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
摩尔线程S5000 + 智源FlagOS:基于原生FP8引擎,Day-0适配DeepSeek-V4
MiniMax M2.7全球开源,摩尔线程、沐曦等完成Day0适配
Day-0支持|摩尔线程率先完成MiniMax M2.7大模型适配
Day-0支持|摩尔线程完成智谱GLM-5.1极速适配,高效支撑长程任务与代码生成
摩尔线程S5000通过智源FlagOS训练验证,精度高出国际主流1.65个百分点
摩尔线程与中国移动研究院等,联合发布128卡高密超节点参考设计,定义超大规模智算底座新标准
摩尔线程MTT S5000全面适配Qwen3.5三款新模型
摩尔线程快速完成对Qwen3.5模型全面适配
Day-0支持|摩尔线程完成MiniMax M2.5模型极速适配
摩尔线程MTT S5000率先完成对GLM-5的适配
Day-0支持|摩尔线程MTT S5000率先完成对GLM-5的适配
国产算力首证具身大脑模型训练实力:摩尔线程联合智源研究院完成RoboBrain 2.5全流程训练
广电计量携手南山研究院打造大健康产业新生态
进迭时空同构融合RISC-V AI CPU的Triton算子编译器实践
摩尔线程携手智源研究院完成基于Triton的大模型算子库适配
评论