搜索历史

清空

搜索热词

0

聊天消息
系统消息
评论与回复

查看更多

查看更多

查看更多

VIP于到期续费

登录后你可以

下载海量资料
学习在线课程
观看技术视频
写文章/发帖/加入社区

会员中心

创作中心

发布

创作活动

完善资料让更多小伙伴认识你，还能领取20积分哦，立即完善>

3天内不再提示

MLPerf首次GPT大模型推理放榜墨芯连续三届登顶

随着ChatGPT等AIGC应用掀起大模型浪潮，算力层作为基础设施，成为最先受益的产业。

然而，算力需求大、费用昂贵等问题，已成为企业落地大模型的普通痛点，更可能制约AI向前发展：大模型参数日益增长，而算力供给瓶颈迫在眉睫，二者形成巨大矛盾。

如何探索更好的大模型算力方案，是业界共同关注的焦点。

近日，全球权威测评MLPerf 公布最新推理测评结果，这是MLPerf首度引入GPT大模型推理测试，参与热度再创纪录，收到了来自英伟达、英特尔、谷歌、高通等企业提交的13500 多项性能结果。

在MLPerf Inference 3.1中，墨芯人工智能（Moffet AI）S30计算卡在大模型GPT-J（60亿参数）上，单卡、4卡、8卡的算力均获得第一。

这是墨芯在MLPerf上连续第三次卫冕。此前墨芯曾在MLPerf Inference 2.0与2.1上，连续两届获得第一。

墨芯的成绩，为大模型算力方案带来了可行的创新方向。

事实证明：结合AI模型与计算平台的软硬协同创新，能够释放更大的算力潜力。这也再度印证：以稀疏计算为代表的创新技术，将是大模型时代算力发展的关键。

墨芯参加的是MLPerf开放分区，据主办方MLCommons介绍，该分区旨在鼓励创新。因此参赛者可以通过软硬协同等方式，探索对算力的提升。在MLPerf中的GPT-J大模型上，与4nm制程的H100纯硬件加速方案相比，12nm制程的墨芯S30计算卡通过“原创的双稀疏算法+硬件协同”方式，取得了高达1.8倍的优势。

本次测评的GPT-J模型是生成式AI模型，墨芯S30计算卡在8卡、4卡、单卡模式下，性能分别为170.59，91.57，23.28 (Sample/s)，达到英伟达H100性能的1.6倍、1.8倍、1.8倍，展现出墨芯产品在AIGC类任务上的能力。

三度夺冠，大模型算力率先“交卷”，软硬协同持续创新——墨芯的产品实力数次经过MLPerf的严格检验，也探索出大模型算力发展的新路径。

1

稀疏计算——大模型“潜力股”

获得市场认可

墨芯接连的优异成绩，主要得益于基于稀疏化算法的软硬协同设计。

在大模型时代，稀疏计算的重要性不言而喻：AI模型大小与其稀疏化潜力成正比。

也就是说，当模型越大，算法上有更大稀疏的可能性，稀疏计算可加速的幅度也越高。对于一般大型语言模型，稀疏计算可带来数十倍加速。

墨芯独创的双稀疏算法，结合软硬协同设计，使墨芯Antoum芯片成为全球首款高稀疏倍率AI芯片，支持高达32倍稀疏——这也正是墨芯在本次MLPerf中创新纪录的关键。

模型越大，稀疏计算的优势越明显——尤其是在GPT等大模型参数动辄上百亿、千亿的现状下，这使得墨芯的护城河更为稳固。

墨芯的产品实力与稀疏计算的大势所趋，也获得了市场的认可：墨芯商业化进程接连取得重要突破，助力企业加速AI应用。

就在近日，墨芯成为支持Byte MLPerf的供应商之一。

来源：Byte MLPerf网站

当前，墨芯AI计算平台已能够支持不同参数级别的大模型，包括 BLOOM, OPT, GPT-J，LLaMA，StableDiffusion等。同时具有高吞吐、低延时、低功耗等特点，缓解算力之困，真正为企业带来“好用”、“用得起”的大模型算力方案。

2

带来根本性的算力变革

稀疏计算助力大模型发展

墨芯的稀疏计算方案不仅能够缓解当前的算力难题，也为AI的持续发展打开新的空间。

稀疏计算减少了AI模型的计算量，这意味着能让大模型既在参数量上跃升若干个数量级的同时，又不产生过大的计算量，大模型参数增长与算力瓶颈的矛盾有望从根本上得到解决。

同时，由于计算量的减少，大模型的高算力需求、高功耗、高费用等痛点，也一并得到解决，实现“多赢”效果。

墨芯Antoum芯片：全球首款高稀疏倍率AI芯片，支持高达32倍稀疏

连续三届MLPerf的优异成绩，不仅是对墨芯产品实力的证明，也为业界带来新启示：在稀疏计算等技术的助力下，大模型的发展与应用有望迎来更广阔的施展空间，加速AIGC等应用在各行各业遍地开花。

审核编辑：刘清

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

GPT

GPT

+关注

关注
0

文章
354

浏览量
15441
AI芯片

AI芯片

+关注

关注
17

文章
1894

浏览量
35106
ChatGPT

ChatGPT

+关注

关注
29

文章
1564

浏览量
7827

原文标题：MLPerf首次GPT大模型推理放榜，墨芯连续三届登顶

文章出处：【微信号：墨芯人工智能，微信公众号：墨芯人工智能】欢迎添加关注！文章转载请注明出处。

评论

相关推荐

立仪科技受邀参加第三届中国传感器与应用技术大会

11月11日，备受瞩目的"第三届中国传感器与应用技术大会"在深圳光明云谷国际会议中心隆重举行。立仪科技作为国内专注光谱共焦传感器领域的公司荣幸受邀参加此次盛会并进行业务签约。立仪科技受邀参加

的头像

发表于 11-15 16:25 •368次阅读

立仪科技受邀参加第<b class='flag-5'>三届</b>中国传感器与应用技术大会

高效大模型的推理综述

大模型由于其在各种任务中的出色表现而引起了广泛的关注。然而，大模型推理的大量计算和内存需求对其在资源受限场景的部署提出了挑战。业内一直在努力开发旨在提高大模型

的头像

发表于 11-15 11:45 •464次阅读

高效大<b class='flag-5'>模型</b>的<b class='flag-5'>推理</b>综述

线上逛展 | 沉浸探索第三届OpenHarmony技术大会五大展区

世博中心又有什么大事发生？第三届OpenHarmony技术大会五大展区全方位展示智慧互联未来雷科技从现场发来探展邀约一起跟随他的视角漫步展区在精彩纷呈的特色产品、应用案例中体验OpenHarmony的快速发展吧！

发表于 10-24 21:50

高燃回顾｜第三届OpenHarmony技术大会精彩瞬间

第三届OpenHarmony技术大会圆满落幕全球开源精英齐聚共同展示OpenHarmony技术、生态、人才的最新进展见证OpenHarmony南北向生态繁荣共绘开源生态发展蓝图星光璀璨致谢

发表于 10-16 18:47

云知声山海多模态大模型UniGPT-mMed登顶MMMU测评榜首

近日，多模态人工智能模型基准评测集MMMU更新榜单，云知声山海多模态大模型UniGPT-mMed以通用能力、医疗专业能力双双排名第一的优异成绩登顶榜首，力压GPT-4V，充分彰显其硬核

的头像

发表于 10-12 14:09 •306次阅读

云知声山海多模态大<b class='flag-5'>模型</b>UniGPT-mMed<b class='flag-5'>登顶</b>MMMU测评榜首

第三届OpenHarmony技术大会亮点纷呈

10月12日—13日第三届OpenHarmony技术大会如期而至，高能看点，一触即发！让我们携手走进这场技术盛宴

的头像

发表于 10-11 11:08 •305次阅读

第<b class='flag-5'>三届</b>OpenHarmony技术大会亮点纷呈

30s高能速递 | 第三届 OpenHarmony技术大会精彩抢鲜看

技术引领筑生态万物智联创未来第三届 OpenHarmony技术大会如约而至高燃登场 10月12-13日，上海世博中心重磅嘉宾，前沿议题看亿万代码如何改变未来，与卓越伙伴共绘闪耀繁星亮点

发表于 10-08 17:36

OpenAI即将发布“草莓”推理大模型

科技界迎来新动态，据可靠消息透露，OpenAI正紧锣密鼓地筹备着一项重大发布——预计在两周内，将正式推出名为“草莓”的新型AI推理模型，并将其无缝融入ChatGPT服务中。这款以卓越推理能力为核心的大模型，旨在突破现有

的头像

发表于 09-11 16:53 •539次阅读

LLM大模型推理加速的关键技术

LLM（大型语言模型）大模型推理加速是当前人工智能领域的一个研究热点，旨在提高模型在处理复杂任务时的效率和响应速度。以下是对LLM大模型

的头像

发表于 07-24 11:38 •926次阅读

佰维存储第三届“Factory Tour”即将启航，诚邀梦想少年共赴精彩“芯”程！

都离不开半导体封装测试的精密工艺它确保了每一颗“芯”的稳定与高效是连接数字世界与物理世界的桥梁想亲眼见证智能设备的强大内“芯”（存储芯片）如何锻造？延续往届的热忱与初心我们再次吹响集结号第三届佰维存储“Facto

发表于 07-08 13:36 •201次阅读

佰维存储第<b class='flag-5'>三届</b>“Factory Tour”即将启航，诚邀梦想少年共赴精彩“<b class='flag-5'>芯</b>”程！

第三届中国电磁频谱学术大会圆满落幕，知语科技闪耀西安！

?西安盛事！第三届中国电磁频谱学术大会圆满落幕，知语云智能科技闪耀全场西安，这座承载着千年历史文化的古都，在2024年6月21日至22日再次成为科技领域的焦点。第三届中国电磁频谱学术大会的圆满收

发表于 06-24 11:05

国芯科技出席第三届中国汽车芯片高峰论坛

6月17-18日，2024首届中国（重庆）智能汽车基础软件生态大会暨第三届中国汽车芯片高峰论坛在重庆召开。本次大会以“基础共筑，开源启航”为主题，由中国汽车工业协会、重庆市经济和信息化委员会、中国电

的头像

发表于 06-20 11:14 •767次阅读

【大语言模型：原理与工程实践】揭开大语言模型的面纱

用于文本生成，根据提示或上下文生成连贯、富有创造性的文本，为故事创作等提供无限可能。大语言模型也面临挑战。一方面，其计算资源需求巨大，训练和推理耗时；另一方面，模型高度依赖数据，需要大规模训练数据才能

发表于 05-04 23:55

全球最强大模型易主，GPT-4被超越

近日，AI领域的领军企业Anthropic宣布推出全新的Claude 3系列模型，其中包括最强版Claude 3 Opus。据该公司称，Claude 3系列在推理、数学、编码、多语言理解和视觉方面全面超越了包括GPT-4在内的所

的头像

发表于 03-05 09:58 •678次阅读

GPT EVAL_BDPS_DRIVER可以使用GPT12 IP或GTM IP来实现连续定时器和单次定时器吗？

GPT EVAL_BDPS_DRIVER可以使用GPT12 IP或GTM IP来实现连续定时器和单次定时器？是吗？

发表于 01-22 08:16