0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

最新MLCommons结果公布 英特尔展现强大AI推理性能

英特尔中国 来源:未知 2023-09-15 19:35 次阅读

近日,MLCommons公布针对60亿参数大语言模型及计算机视觉与自然语言处理模型GPT-J的MLPerf推理v3.1性能基准测试结果,其中包括英特尔所提交的基于HabanaGaudi2加速器、第四代英特尔至强可扩展处理器,以及英特尔至强CPU Max系列的测试结果。该结果显示了英特尔在AI推理方面极具竞争力的表现,并进一步加强了其对加速从云到网络到边缘再到端的工作负载中大规模部署AI的承诺。

正如最新的MLCommons结果显示,我们拥有强大的、具有竞争力的人工智能产品组合以满足客户对高性能、高效率的深度学习推理及训练的需求,同时,针对各种规模的人工智能模型,英特尔产品组合均具有领先的性价比优势。

--Sandra Rivera

英特尔执行副总裁

兼数据中心与人工智能事业部总经理

根据6月披露的MLCommonsAI训练结果1和Hugging Face性能基准测试2验证,Gaudi2在先进的视觉语言模型上拥有卓越的性能,而今天的结果进一步证明了英特尔能够提供满足AI计算需求的绝佳解决方案。

考虑到客户的个性化需求,英特尔正在通过能够帮助解决AI工作负载中推理与训练问题的产品,让AI无处不在。英特尔的AI产品为客户提供了可根据各自性能、效率及目标成本进行灵活匹配以获取最佳AI解决方案的理想选择,同时亦帮助客户开放生态系统。

wKgZomUEQpSAGFIyAABOUcjx2Xw150.gif

关于Habana Gaudi2的测试结果:

Habana Gaudi2在GPT-J模型上的推理结果强有力地验证了其具有竞争力的性能。

Gaudi2在GPT-J-99和GPT-J-99.9上的服务器查询和离线样本的推理性能分别为78.58次/秒和84.08次/秒。

Gaudi2提交的结果采用FP8数据类型,并在这种新数据类型上达到了99.9%的准确率。

随着每6-8周公布的Gaudi2软件更新,英特尔将继续在MLPerf基准测试中展现其产品的性能提升,以及持续扩大的模型覆盖范围。

wKgZomUEQpSAOHLSAAXSxMWr49Y014.png

Habana Gaudi2在GPT-J模型上的推理结果

验证了其具有竞争力的性能

wKgZomUEQpSAGFIyAABOUcjx2Xw150.gif

关于第四代至强可扩展处理器的测试结果:

英特尔提交了基于第四代英特尔至强可扩展处理器的7个推理基准测试,其中包括GPT-J模型。结果显示,包括视觉、语言处理、语音和音频翻译模型,以及更大的DLRM v2深度学习推荐模型及ChatGPT-J模型在内,第四代至强处理器对于通用AI工作负载拥有出色的性能。此外,截至目前,英特尔仍是唯一一家使用行业标准的深度学习生态系统软件提交公开CPU结果的厂商

第四代英特尔至强可扩展处理器是通过流行的AI框架与库构建及部署通用AI工作负载的理想选择。对于GPT-J对约1000-1500字新闻稿进行100字总结的任务,第四代至强可扩展处理器可在离线模式下完成每秒两段的总结提要,在实时服务器模式下完成每秒一段的总结提要。

英特尔首次提交了英特尔至强CPU Max系列的MLPerf结果,该系列可提供高达64GB的高带宽内存。对于GPT-J而言,它是仅有的能够达到99.9%准确度的CPU,这对于对精度要求极高的应用来说至关重要。

英特尔与OEM厂商合作提交了测试结果,进一步展示了其AI性能的可扩展性,以及基于英特尔至强处理器的通用服务器的可获取性,充分满足客户服务水平协议(SLA)。

wKgZomUEQpWAFJSKAAO8Ll3VFIE534.png

第四代至强可扩展处理器

是构建及部署通用AI工作负载的理想选择

MLPerf是业内享有盛名的AI性能基准测试,旨在实现公平、可重复的产品性能比较。英特尔计划为下一个MLPerf测试提交新的AI训练性能结果。持续的性能更新彰显了英特尔致力于帮助客户、助力AI技术演进所迈出的每一步,无论是低成本的AI处理器,还是面向网络、云和企业用户的高性能AI硬件加速器或是GPU

注释:

  1. https://www.intel.com/content/www/us/en/newsroom/news/new-mlcommons-results-ai-gains-intel.html#gs.51njha

  2. https://huggingface.co/blog/bridgetower


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10071

    浏览量

    172875
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10947

    浏览量

    213895

原文标题:最新MLCommons结果公布 英特尔展现强大AI推理性能

文章出处:【微信号:英特尔中国,微信公众号:英特尔中国】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    英特尔发布最强大的商用AI PC产品阵容

    处理器。在台式机和移动设备形态中,该产品组合为全球企业提供包含计算性能、能效、连接性、安全性和可管理性的全面解决方案。 如今是PC更新换代的关键节点,凭借英特尔 酷睿 Ultra处理器(第二代),我们为客户带来了
    的头像 发表于 03-08 09:28 263次阅读

    英特尔®独立显卡与OpenVINO™工具套件结合使用时,无法运行推理怎么解决?

    使用英特尔®独立显卡与OpenVINO™工具套件时无法运行推理
    发表于 03-05 06:56

    英特尔至强6助力HPE Gen12,AI推理性能提升3倍!

    ,CPU处理器永远都是C位的存在,没有它的基础性支撑,其他一切都是空中楼阁。 当然,CPU处理器也在积极适应新的时代趋势,既要不断增强计算性能,也要低碳环保提高能效,但它们俩如同硬币的正反面,不可能完美兼顾,那该怎么办呢? 对此,英特尔的解决方案是兵分
    的头像 发表于 02-18 14:18 143次阅读
    <b class='flag-5'>英特尔</b>至强6助力HPE Gen12,<b class='flag-5'>AI</b><b class='flag-5'>推理性能</b>提升3倍!

    使用NVIDIA推理平台提高AI推理性能

    NVIDIA推理平台提高了 AI 推理性能,为零售、电信等行业节省了数百万美元。
    的头像 发表于 02-08 09:59 322次阅读
    使用NVIDIA<b class='flag-5'>推理</b>平台提高<b class='flag-5'>AI</b><b class='flag-5'>推理性能</b>

    英特尔酷睿Ultra 200V系列移动处理器亮相CES 2025

    基于英特尔 vPro 平台的全新英特尔 酷睿 Ultra 200V系列移动处理器,为企业提供 AI 驱动的生产力和提升的IT管理能力1。该产品不仅拥有卓越的性能、效率和非凡的商务计算能
    的头像 发表于 01-20 09:21 391次阅读

    英特尔塑造未来出行:AI增强型软件定义汽车

    的车载体验,将未来出行变为现实。 英特尔的展示不仅展现了其技术的卓越与先进,更是对未来汽车体验的一次生动呈现。AI增强型SDV(软件定义汽车)平台是英特尔这一愿景的核心,该平台融合了高
    的头像 发表于 01-14 11:20 286次阅读

    MLCommons推出AI基准测试0.5版

    开放式机器学习工程联盟 MLCommons 在美国加州当地时间公布推出适用于消费类 PC 的 AI 性能的 MLPerf Client 基准测试的 0.5 版,这是该测试的第一个公开版
    的头像 发表于 12-12 16:47 519次阅读

    英特尔推出全新英特尔锐炫B系列显卡

    备受玩家青睐的价格提供卓越的性能与价值1,很好地满足现代游戏需求,并为AI工作负载提供加速。其配备的英特尔Xe矩阵计算引擎(XMX),为新推出的XeSS 2提供强大支持。XeSS 2的
    的头像 发表于 12-07 10:16 1022次阅读
    <b class='flag-5'>英特尔</b>推出全新<b class='flag-5'>英特尔</b>锐炫B系列显卡

    英特尔AI PC无所不能的实力

    百业的最后一公里问题。而客户端的AI能力也在不断提升,最终将解决个人AI的数据隐私和个性化问题。可见,AI非常适合云边端三级架构,按照用户场景进行针对性部署。英特尔为云边端都提供了
    的头像 发表于 10-12 10:26 537次阅读

    开箱即用,AISBench测试展示英特尔至强处理器的卓越推理性能

    。 中国电子技术标准化研究院赛西实验室依据国家标准《人工智能服务器系统性能测试规范》(征求意见稿)相关要求,使用AISBench 2.0测试工具,完成了第五代英特尔至强可扩展处理器的AI大模型
    的头像 发表于 09-06 15:33 517次阅读
    开箱即用,AISBench测试展示<b class='flag-5'>英特尔</b>至强处理器的卓越<b class='flag-5'>推理性能</b>

    英特尔IT的发展现状和创新动向

    AI大模型的爆发,客观上给IT的发展带来了巨大的机会。作为把IT发展上升为战略高度的英特尔,自然在推动IT发展中注入了强劲动力。英特尔IT不仅专注于创新、AI和优化,以及
    的头像 发表于 08-16 15:22 715次阅读

    英特尔发布AI创作应用AI Playground,将于今夏正式上线!

    AI PC入门应用程序AI Playground,让广大用户在本地即可快速实现AI个性化创作。 英特尔Xe2 GPU架构,带来50%的性能
    的头像 发表于 06-14 09:44 605次阅读
    <b class='flag-5'>英特尔</b>发布<b class='flag-5'>AI</b>创作应用<b class='flag-5'>AI</b> Playground,将于今夏正式上线!

    英特尔CEO:AI时代英特尔动力不减

    英特尔CEO帕特·基辛格坚信,在AI技术的飞速发展之下,英特尔的处理器仍能保持其核心地位。基辛格公开表示,摩尔定律仍然有效,而英特尔在处理器和芯片技术上的创新能力将持续驱动公司前进。
    的头像 发表于 06-06 10:04 525次阅读

    英特尔助力京东云用CPU加速AI推理,以大模型构建数智化供应链

    英特尔助力京东云用CPU加速AI推理,以大模型构建数智化供应链
    的头像 发表于 05-27 11:50 649次阅读
    <b class='flag-5'>英特尔</b>助力京东云用CPU加速<b class='flag-5'>AI</b><b class='flag-5'>推理</b>,以大模型构建数智化供应链

    宁畅B5000 G5多节点服务器采用第五代英特尔至强可扩展处理器

    “基于第五代英特尔 至强 可扩展处理器的宁畅B5000 G5多节点服务器,可以在满足大量AI推理场景在吞吐量、时延、容量、并发能力等方面的需求,而且与专用的GPU服务器相比,在灵活性方面更具优势。我们希望能够与
    的头像 发表于 05-27 11:46 974次阅读
    宁畅B5000 G5多节点服务器采用第五代<b class='flag-5'>英特尔</b>至强可扩展处理器