1月11日下午,以“芯加速 行至远”为主题的第四代英特尔至强新品发布会在北京正大中心盛大举行。英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰正式介绍了英特尔第四代至强可扩展处理器,英特尔至强CPU Max系列(代号
“Sapphire Rapids HBM”)以及英特尔数据中心GPU Max系列(代号“Ponte Vecchio”)。
图:英特尔市场营销集团副总裁、中国区数据中心销售总经理
兼中国区运营商销售总经理 庄秉翰
至强处理器的发展历程
作为数据中心平台和解决方案的技术引领者,英特尔产品为全球的客户和行业伙伴提供了坚实的算力基础。目前,至强处理器的安装量已超过一亿——从运行IT服务的本地服务器其中包括全新的即服务商业模式,到管理互联网流量的网络设备,再到进行边缘计算的无线基站和云服务等。
自2017年Intel推出第一款至强和扩展处理器以来,英特尔已经向全球客户交付了超过8,500万颗的至强可扩展处理器,支持了全世界数据中心。在过去2年,第三代至强可扩展处理器已经在全球累计出货1,500万颗。
图:英特尔市场营销集团副总裁兼中国区总经理 王稚聪
英特尔市场营销集团副总裁兼中国区总经理王稚聪表示:“中国5G网络建设具有重大的意义,使得网络和计算逐渐融为一体,使得感知、计算、数据、存储、数据中心得以实现无缝连接,由此在中国形成了一个巨大的网络。国家提出“东数西算”,运营商朋友在做算力网络的构建,都是在中国有非常宏大的构想,能够把远端的大型数据中心,以及算力逐渐蔓延到边缘,以及网络的智能调度、切片,以及前端的传感统一调度起来。
由此之上建立的数据流,以及对工作负载平衡的处理,AI的各种加速,提供了一个非常丰富而充满乐趣和创造力的环境。第四代英特尔至强可扩展处理器的发布,就是面对这样的计算环境,助力合作伙伴新业务需求。”
七大神器助力第四代至强服务器打造超强能力
庄秉翰指出,第四代至强服务器芯片采用Intel7的制程工艺制造,具有全新的芯片架构,通过集成高性能和更多的内核数量,业内高需求的数据中心工作负载的相关加速器,以及业界领先的DDR5,CXL1.1,PCIe5.0和高带宽内存,以提供高吞吐量、低时延性能,让加速无所不在。
图:第四代至强服务器芯片展示
这些加速体验体现在全新的至强平台所提供的七大算力神器。
一、加速深度学习,实时推理和训练性能提升的IntelAMX加速器;
二、加速处理网络数据系统及系统性的性能提升的Intel VOD加速器;
三、加速在存储网络工作负载中常见的流数据移动的Intel DSA加速器;
四、加速在数据分析工作负载中内存占用优化和查询吞吐量的Intel IAA加速器;
五、加速在网络吞吐量以及压缩解压缩功能的IntelQAT加速器;
六、加速平台安全性能的Intel安全技术策略组合;
七、提供内置高带宽内存的Intel至强CPU Max系列。
与前一代相比,第四代英特尔至强可扩展处理器通过内置加速器将目标工作负载的平均每瓦性能提升了2.9倍,在优化电源模式下每个CPU节能高达70瓦,并对性能只产生极低的影响,同时将总体拥有成本降低52%到66%。
可持续性
第四代英特尔至强可扩展处理器拥有丰富的内置加速器,意味着英特尔能够提供平台级的功率节省,并缓解对额外独立加速方面的需求,帮助客户实现可持续发展目标。此外,新的优化电源模式可以为某些工作负载带来高达20%的插槽节能,而对性能的影响仅有不到5%。风冷和液冷的创新进一步降低了数据中心的总能耗,且第四代至强可扩展处理器在英特尔工厂制造时,运用了超过90%的可再生电力,并同时配备了一流的水资源回收设施。
人工智能
在AI方面,与前一代相比,通过内置英特尔高级矩阵扩展(英特尔AMX)加速器,第四代英特尔至强可扩展处理器将PyTorch实时推理和训练性能提升了10倍。第四代英特尔至强还将广泛的AI工作负载的推理和训练性能提升到新的高度。英特尔至强CPU Max系列在这些功能的基础上针对自然语言处理进行了扩展,将大型语言模型的处理速度提升多达20倍。借助英特尔的AI软件套件,开发者可以使用自己选择的AI工具,提高生产力并加快AI开发速度。该套件可以从工作站进行移植,使其可以在云中扩展,并一直扩展到边缘。同时,该套件已经针对400多个机器学习和深度学习AI模型进行了验证,涵盖所有商业细分领域最常见的AI应用场景。
网络
第四代英特尔至强包含一系列针对高性能、低时延网络和边缘工作负载进行了特别优化的处理器产品。对于如今电信、零售、制造和智慧城市等行业正在推动更加软件定义的未来,这些处理器将发挥关键性基石作用。对于5G核心工作负载,内置加速器有助于提高吞吐量和降低时延,而电源管理的升级则提高了平台的响应能力和能效。此外,与前几代相比,第四代英特尔至强在不增加功耗的情况下提供多达两倍的虚拟无线接入网(vRAN)容量。这使通信服务提供商能够将每瓦性能提高一倍,满足其关键的性能、扩展和能效需求。
科学计算
第四代英特尔至强可扩展处理器和英特尔Max系列产品具备可扩展、平衡的架构,其中整合了CPU、GPU和oneAPI的开放软件生态系统,适用于科学计算和AI等领域要求严苛的计算工作负载,旨在帮助解决全球最具挑战性的问题。
第四代英特尔至强内置英特尔AMX专属AI加速器,大幅提升矩阵乘法运算,为人工智能加速提供了全新方式,与上一代(FP32)相比,内置英特尔高级矩阵扩展(英特尔AMX)(BF16)的PyTorch实时AI推理和训练性能提高了10倍。结合通用CPU计算单元,第四代英特尔至强可扩展处理器可以端到端运行任何AI工作负载。
英特尔至强CPU Max系列是集成高带宽内存的x86处理器,能够在无需变更代码的情况下为科学计算工作负载加速。英特尔数据中心GPU Max系列提供极高的计算密度,且具有多种产品规格以满足不同的客户需求。
英特尔至强CPU Max系列可提供64GB的高带宽内存(HBM2e),为科学计算和AI工作负载大幅提高了数据吞吐量。与第三代英特尔至强可扩展处理器的高端SKU相比,英特尔至强CPU Max系列可为如能源、地球系统建模等一系列实际应用提供高达3.7倍的性能提升。
此外,英特尔数据中心GPU Max系列在单个产品上整合47个小芯片,集成了超过1000亿个晶体管,为诸如物理、金融服务和生命科学等极具挑战性的工作负载带来更高的吞吐量。相较上一代产品,英特尔数据中心GPU Max系列和至强CPU Max系列的结合,可以使生命与材料科学领域LAMMPS处理性能提升12.8倍。
合作案例分享
腾讯云星星海实验室研发总监曾钦杵现场分享一下腾讯云与英特尔的合作状况。
腾讯云在云服务器方面,基于英特尔最新的Sapphire Rapids CPU进行了全面升级,推出了腾讯云第七代云服务器,标准型的S7和内存型的M7这样的云实例,这两款产品全面应用了腾讯云和英特尔的全新软硬件技术,充分发挥了目前产品的新特性,在计算、存储和网络多方面都做了全方位的性能提升。
腾讯云星星海自研服务器,基于Sapphire Rapids CPU可以提供先进的IO处理能力,包括目前最新一代的PCIe Gen 5,以及下一代IO接口标准CXL1.1,内存接口部分也从DDR4升级到了最新的DDR5内存接口。在存储领域,可以提供高达100万IOPS的存储性能,通过傲腾持久内存的助力,我们可以实现端到端的存储延时,达到40ms的级别,真正意义上达到了10纳秒云存储的新的性能指标。
在网络配置方面,星星海自研服务器通过搭载腾讯自研的“银杉”智能网卡,网络性能可以提供高达5000万PPS的网络性能。面对不同的业务场景,Sapphire Rapids提供了多个全新的内嵌的加速器。
中国电信5G云网能力提升,Intel第四代至强处理器助阵
随着5G网络的广泛应用,每一年移动数据流量增长50%,主要来自各种视频内容的增长,占到了全部流量的66%。要支撑流量增长的要求,运营商需要极大地增加网络容量和吞吐能力,加速网络工作负载的系统级处理性能。
天翼云云网产品事业部的杨鑫分享了和英特尔的合作,解决运营商工作负载不断提升的挑战。
经过十年的发展,天翼云目前已经是全球最大的运营商云和国内最大的混合云。据IDC今年发布的报告,天翼云在公有云IaaS市场已经排名第三,成为国内一线云服务提供商。
中国电信和英特尔一起合作推出天翼云的第八代云主机,基于英特尔第四代英特尔至强可扩展处理器。基于英特尔的芯片架构,天翼云第八代弹性云主机可以支持128vCPU的大规格实例,支持8通道的DDR5内存,包括单条的内存带宽高达4800MT/S,性能较上一代有大幅度提升。
基于第四代英特尔至强可扩展处理器的英特尔DLB的特性,天翼云有超过200万的政企客户,很多政企客户除了提供普通的互联网上云,对政企客户我们重点提供了云专线、SD-WAN和VPN上云,而这个上云会采用IPSec加密隧道来做处理。传统的方式对性能有较大的影响,特别是大带宽的场景下,它是占据了某颗CPU的转发能力,影响同CPU的其他业务量的传输,而造成丢包、拥塞的业务质量下降。而通过和英特尔的合作,天翼云利用CPU的英特尔DLB硬件加速特性,针对IPSec的大象流处理做了优化。相比之前的纯软件方案,英特尔DLB的加速方案稳定可靠,带来了更好的线性扩展,最高可以达到4倍以上的吞吐收益,有效解决了在入云环节针对大象流加密处理的业务难题。
-
处理器
+关注
关注
68文章
19156浏览量
229082 -
英特尔
+关注
关注
60文章
9879浏览量
171434 -
数据中心
+关注
关注
16文章
4675浏览量
71948
发布评论请先 登录
相关推荐
评论