0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

开箱即用,AISBench测试展示英特尔至强处理器的卓越推理性能

looger123 来源:looger123 作者:looger123 2024-09-06 15:33 次阅读

近期,第五代英特尔®至强®可扩展处理器通过了中国电子技术标准化研究院组织的人工智能服务器系统性能测试(AISBench)。英特尔成为首批通过AISBench大语言模型(LLM)推理性能测试的企业。

中国电子技术标准化研究院赛西实验室依据国家标准《人工智能服务器系统性能测试规范》(征求意见稿)相关要求,使用AISBench2.0测试工具,完成了第五代英特尔至强可扩展处理器的AI大模型推理性能和精度测试。测试中,第五代英特尔至强在ChatGLM V2-6B(60亿参数)以及 Llama2-13B(130亿参数)两个模型上均展现出卓越推理性能,能够满足轻量级大语言模型的实时推理要求。

wKgZombasFCAOb28AAQWiisN-UI496.png

测试结果:此次单机性能测试中,在满足人类正常阅读速度要求(生成延迟小于100毫秒)的情况下,在封闭测试场景中构造数据集,基于第五代英特尔至强的服务器可实现:

在60亿参数的ChatGLM V2模型通用推理中,当输入输出序列为256时可达每秒2493 token的性能,当输入输出序列为2048时可达每秒926 token。

在130亿参数的Llama2模型通用推理中,当输入输出为256时可达每秒513 token,当输入输出序列为2048时可达每秒132 token1。


作为通用处理器,第五代英特尔至强在人工智能、网络、存储、数据库等关键工作负载均能提供出色性能。AISBench2.0的测试结果验证了英特尔至强在运行轻量级大语言模型时展现出的优异推理性能,使得客户可以使用基于至强的服务器,构建一个通用AI系统进行数据预处理、模型推理和部署,从而获得兼具AI性能、效率、准确性和可扩展性的组合。这也彰显了英特尔至强可以为企业提供“开箱即用”的功能,即可以在通用系统上部署一部分AI工作负载,从而为客户带来更佳的总体拥有成本(TCO)优势。

软硬结合,至强展现AI优势

英特尔至强的内置AI加速器使其成为在通用处理器上运行部分AI工作负载的理想解决方案,不仅如此,英特尔还配备了经过优化的、易于编程的开放软件,可降低客户和生态伙伴在数据中心部署从云到智能边缘各种基于AI的解决方案的门槛。

第五代英特尔至强可扩展处理器充分发挥了系统级优势(包括缓存、内存等),因此推理速度实现了大幅提升。

其内置的AI加速器——英特尔®高级矩阵扩展(AMX),通过提供专用的矩阵运算加速模块(TMUL),以及支持INT8和BF16这类低精度数据类型,可实现对计算资源的充分利用,从而大幅提升运算效率。

xFasterTransformer(简称xFT)是英特尔提供的在CPU平台上部署大语言模型的深度优化开放解决方案,通过C++Python两种API接口,更易于用户使用和将其集成到自有业务框架中。

关于AISBench

AISBench基准是一套应用于人工智能计算产品的性能测试基准,由中国电子技术标准化研究院牵头研制。与MLPerf等国际先进计算基准类似,该基准用于测试多种人工智能计算产品形态,并支持丰富的测试场景、模式、类型和指标。

产品与性能信息

1.服务器:在搭载第五代英特尔®至强®处理器的Quanta Cloud Technology 服务器 QuantaGrid D54Q-2U上测量,CPU:英特尔至强铂金8592+、64核,超线程开启、睿频开启、NUMA 4,内存:1.5 TB、硬盘:Intel P5800X 3.2TB NVME ,、操作系统:Ubuntu 22.04、测试软件:AISBench、深度学习框架:PyTorch 2.3.1、模型数据精度:BF16。英特尔于2024年6月26日至7月26日进行测试。

客户端:第十一代英特尔®酷睿™i7-1185G7:在戴尔Latitude 7420上测量,内存:16.0 GB、硬盘:256 GB、操作系统:Microsoft Windows 11Enterprise、测试软件:MobaXtermPersonalEdition v22.0 Build 4858。英特尔于2024年6月26日至7月26日进行测试。

测试工具:性能测试工具AISBench 2.0。

免责声明

性能因使用情况、配置和其他因素而异。欲了解更多信息,请访问性能指数网站。性能结果基于截至所示日期的测试,可能无法反映所有公开可用的更新。请参阅备份以了解配置详情。没有任何产品或组件是绝对安全的。您的成本和结果可能会有所不同。英特尔技术可能需要启用硬件、软件或激活服务。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    60

    文章

    9740

    浏览量

    170628
  • 至强处理器
    +关注

    关注

    0

    文章

    22

    浏览量

    9152
收藏 人收藏

    评论

    相关推荐

    采用144核,能效提升66%!英特尔至强6处理器震撼上市,加速数据中心升级

    6能效核处理器基于Intel 3制程工艺,凭借高核心密度及出色的每瓦性能,可在提供高效算力的同时显著降低能源成本。英特尔至强6700E采用144核,可以满足高密度计算需求。令人兴奋的是
    的头像 发表于 06-11 18:13 5916次阅读
    采用144核,能效提升66%!<b class='flag-5'>英特尔</b><b class='flag-5'>至强</b>6<b class='flag-5'>处理器</b>震撼上市,加速数据中心升级

    英特尔首款至强6处理器上市

    在北京这座古都的现代舞台上,英特尔®举行了一场别开生面的新品发布会,主题为“绿色向新,释放新质生产力”。此次盛会聚焦在英特尔至强® 6能效核处理器上,这一划时代的产品不仅代表着
    的头像 发表于 06-11 09:51 424次阅读

    英特尔发布至强6能效核处理器

    英特尔近日发布了一款革命性的处理器产品——至强6(代号Sierra Forest)。这款处理器以其独特的能效核设计和基于Intel 3制程工艺的技术,在提供
    的头像 发表于 06-07 15:55 439次阅读

    浪潮信息元脑®服务率先支持英特尔®至强®6处理器

    支持最新英特尔®至强®6处理器,具备更出色的性能和能效表现,相比第三代至强处理器
    的头像 发表于 06-07 15:36 237次阅读
    浪潮信息元脑®服务<b class='flag-5'>器</b>率先支持<b class='flag-5'>英特尔</b>®<b class='flag-5'>至强</b>®6<b class='flag-5'>处理器</b>

    宁畅B5000 G5多节点服务采用第五代英特尔至强可扩展处理器

    “基于第五代英特尔 至强 可扩展处理器的宁畅B5000 G5多节点服务,可以在满足大量AI推理场景在吞吐量、时延、容量、并发能力等方面的需
    的头像 发表于 05-27 11:46 624次阅读
    宁畅B5000 G5多节点服务<b class='flag-5'>器</b>采用第五代<b class='flag-5'>英特尔</b><b class='flag-5'>至强</b>可扩展<b class='flag-5'>处理器</b>

    英特尔展示下一代至强处理器,助力vRAN性能显著提升

    里程碑事件不仅凸显了移动行业推动vRAN和Open RAN发展的长期投入,也表明了英特尔正在持续践行其以领先的产品路线图助力行业发展的坚定承诺。代号为Granite Rapids–D的下一代至强处理器将于2025年发布,这款
    的头像 发表于 03-01 15:43 298次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>展示</b>下一代<b class='flag-5'>至强</b><b class='flag-5'>处理器</b>,助力vRAN<b class='flag-5'>性能</b>显著提升

    英特尔至强处理器优化升级,助力打造未来高能效数据中心

    英特尔最新发布的第五代至强可扩展处理器,拥有多达64个核心,性能提升高达1.4倍。 英特尔于去年12月正式推出了拥有多达64个核心的第五代
    的头像 发表于 02-26 17:39 581次阅读

    性能存储实现新突破的英特尔至强处理器

    基于第四代英特尔 至强 可扩展处理器的 Curve 高性能分布式存储方案在吞吐、时延、TCO 等方面具备出色优势,能够为金融、互联网、交通、能源等各行业提供高效的云原生存储解决方案。
    发表于 02-26 14:01 358次阅读
    高<b class='flag-5'>性能</b>存储实现新突破的<b class='flag-5'>英特尔</b><b class='flag-5'>至强</b><b class='flag-5'>处理器</b>

    英特尔专家为您揭秘第五代英特尔® 至强® 可扩展处理器如何为AI加速

    % 1 ,AI 推理性能提升42% 2 。 这一系列性能提升的背后,存在着怎样的创新与突破?第五代英特尔 至强 可扩展处理器为什么要强调为A
    的头像 发表于 12-23 12:20 627次阅读

    CPU也可以完美运行大模型 英特尔第五代至强重磅发布

    大语言模型(LLM)已经在多个领域展示出了卓越性能和巨大的潜力,然而,要想真正发挥出这些模型的强大能力,需要强大的算力基础设施,而芯片是关键。 千呼万唤始出来,第五代英特尔®️
    的头像 发表于 12-22 11:52 506次阅读
    CPU也可以完美运行大模型 <b class='flag-5'>英特尔</b>第五代<b class='flag-5'>至强</b>重磅发布

    宝德服务全面升级到第五代英特尔®至强®平台

    发布全新一代基于第五代英特尔®至强®可扩展处理器的宝德服务。   卓越性能,新一代宝德服务
    的头像 发表于 12-21 16:12 539次阅读
    宝德服务<b class='flag-5'>器</b>全面升级到第五代<b class='flag-5'>英特尔</b>®<b class='flag-5'>至强</b>®平台

    AI 无处不在,英特尔酷睿Ultra 和第五代英特尔至强可扩展处理器正式发布

    英特尔  酷睿 Ultra处理器和第五代英特尔   至强   可扩展处理器支持的AI产品亮相,展现了英特
    的头像 发表于 12-16 16:05 575次阅读
    AI 无处不在,<b class='flag-5'>英特尔</b>酷睿Ultra 和第五代<b class='flag-5'>英特尔</b><b class='flag-5'>至强</b>可扩展<b class='flag-5'>处理器</b>正式发布

    英特尔发布酷睿Ultra和第五代至强可扩展处理器

    战略的发布,以及英特尔 酷睿 Ultra处理器和第五代英特尔 至强 可扩展处理器支持的 AI 产品亮相,展现了
    的头像 发表于 12-16 15:23 1111次阅读

    英特尔发布第五代至强可扩展处理器性能和能效大幅提升,AI 加速

    此外,至强可扩展处理器被誉为行业首屈一指的内置AI加速数据中心处理器,全新第五代产品更能优化参数量高达200亿的大型语言模型,使其推理性能
    的头像 发表于 12-15 11:02 691次阅读

    用上这个工具包,大模型推理性能加速达40倍

    作者: 英特尔公司 沈海豪、罗屿、孟恒宇、董波、林俊 编者按: 只需不到9行代码, 就能在CPU上实现出色的LLM推理性能英特尔  Extension for Transformer 创新
    的头像 发表于 12-01 20:40 963次阅读
    用上这个工具包,大模型<b class='flag-5'>推理性能</b>加速达40倍