0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用面向网络优化的新一代处理器,实现高吞吐量与低时延

英特尔中国 来源:未知 2023-06-05 19:45 次阅读

截至 2022 年底,中国累计建成开通 5G 基站 231.2 万个,5G 用户达 5.61 亿户,全球占比均超过 60% 1。随着 5G 网络的不断扩展和智能边缘需求的激增,通信服务提供商(CoSP)需要考量从边缘到数据中心再到云端分布的网络功能优化和性能提升,实现精细化的流量处理,才能提升投资回报率(ROI)。

内置多个硬件加速器为分布式网络多场景工作负载提速 相较于昂贵的外部加速器构建自定义系统的做法,第四代英特尔至强 可扩展处理器提供了标准化且可扩展的平台,将多种硬件加速器直接内置于 CPU中。这种技术上的进步让通信服务提供商较以往更能基于通用系统量身定制执行方案,从而优化性能、能效和安全性。这种能力使 CPU 得到更高效的利用,提升了可持续发展能力与投资回报率,同时降低了电耗。

由于这些加速器内置于处理器中,因此网络运营商无需购置外部硬件加速器便可获得更高的吞吐量、更低的时延。这种架构具有明显的能效优势,因为它无需另行为外部设备供电,也无需通过 PCIe 总线在内核与加速器硬件之间传输数据。此外,用户还可以在非高峰时段将通用硬件资源用于支持其他任务,如训练 AI机器学习模型或是进行数据分析。加速器与处理器内核毗邻,还省去了 PCIe 总线的传输时间,从而使敏感型网络工作负载的时延情况得到改善。

具体地,英特尔高级矩阵扩展(英特尔 AMX)可提升人工智能负载的性能,在 SASE 和 vRAN 的部署上进行卓有成效地进行网络工作负载调优,实现效率与效能的提升。英特尔高级矢量扩展 512(英特尔 AVX-512)采用最新 x86 矢量指令集,有助于在更大的数据集上(包括在 SASE 和 vRAN 等网络工作负载中)更快地完成计算。英特尔动态负载均衡器(英特尔 DLB)可优化跨多个内核的网络数据处理工作负载,诸如支持视频流多路同步连接的 CDN。英特尔数据流加速器(英特尔 DSA)能够卸载大规模部署中会产生开销的常见数据传输任务来提升流数据传输速度,这对包括 CDN 在内的流式网络工作负载的性能来说至关重要。英特尔数据保护与压缩加速技术(英特尔 QAT)可减少加密和数据压缩相关开销,在提高包括 SASE、CDN 和 5G UPF 工作负载在内的网络性能上起着非常重要的作用。

第四代英特尔至强 可扩展处理器及多个内置加速器的加持,使分布式网络部署多种需求的性能得到提升:

提供高能效运行、高密度连接及更大内存带宽,帮助用户更轻松地处理快速增长的 UPF 数据,实现5G 无线核心网用户UPF吞吐量提升1.88倍3

面向 mMIMO(大规模多入多出)工作负载提供高吞吐量和低延时,在使用全新英特尔AVX的情况下使5G vRAN 吞吐量提升2倍4

助力SASE监控不断扩大的攻击面并支持下一代防火墙 (NGFW) 的部署,实现快速响应,吞吐量提升1.71倍5

通过改善负载均衡情况优化内容分发工作负载性能,在使用NGINX时实现CDN线性吞吐量提升1.46倍6

为有线网络和多系统运营商 (MSO)的vCMTS 工作负载性能提升2倍7

专为网络工作负载量身定制多工作模式使CPU效能得到完美发挥 面向网络优化的第四代英特尔至强 可扩展处理器专为网络工作负载量身定制,具有以下新特性:

先进的执行资源多种核数与功能配置,在众多内置加速器加持下单核性能比上一代产品更出色。

更强大的内存子系统:多达 8 条传输速率高达 4800 MT/s 的 DDR5 通道,与上一代产品相比,内存带宽和速度提升了 1.5 倍。

速度更快、容量更大的 I/O:每路处理器多达 80 条 PCIe 5.0 通道。

数据在使用中也能得到保护:由基于英特尔 软件防护扩展(Intel Software Guard Extensions,英特尔 SGX)的机密计算技术提供支持,该技术会将密码和加密密钥等保密信息隔离在专有的内存飞地中。

同时,面向网络优化的第四代英特尔至强 可扩展处理器针对网络、服务器和计算优化型工作负载提供多种工作模式,使通信服务提供商拥有部署一种类型的服务器便可满足多种用例需求的灵活性,从而简化了采购和后勤工作,降低TCO。

多种工作模式基于英特尔 Speed Select 技术(英特尔 SST),使运营商可以更主动、精细地控制 CPU 性能,同时提高软件在整个运行环境中的复用率,根据特定需求更好地量身定制执行方案。

多种工作模式包括:

“网络模式”已面向高吞吐量和低时延需求进行了性能优化,采用高处理器频率支持数据平面、控制平面和信号处理工作负载。

“服务器模式”在降低内核频率的同时仍能在相同的功耗范围内运行,可满足通用处理工作负载的需求。

“IT 模式”旨在支持时延要求更低的 IT 工作负载。例如,在非高峰时段,“IT 模式”下的系统可以执行运营支持系统和业务支持系统 (OSS/BSS) 等后台功能。

aab01196-0387-11ee-90ce-dac502259ad0.png

目前,面向网络优化的第四代英特尔至强可扩展处理器推出中等内核数(Medium Core Count, MCC) 和超多内核数(Extreme Core Count, XCC) 两种配置。内置于 MCC 和 XCC 处理器中的加速器可分别加速数据传输和压缩,从而实现更高的网络性能;可提升查询吞吐量,从而实现响应更加迅捷的数据分析;同时还可卸载调度和队列管理,在内核之间实现工作负载的动态平衡。 此外,英特尔在软件支持方面进行了大量投入,为开发人员简化了内置加速器及其他英特尔架构特性和功能的实现。为保证加速器能为开发人员所用,英特尔为生态系统提供多种支持,从应用到底层要素(如驱动程序、库和 API),各种开源及专有软件支持等,并为客户提供能够获得广泛支持的网络解决方案。

资料援引:1. 国家互联网信息办公室《数字中国发展报告(2022年)》,http://www.cac.gov.cn/2023-05/22/c_1686402318492248.htm2,3. 详情请见以下网址的[N8]:https://edc.intel.com/content/www/cn/zh/products/performance/benchmarks/processors/(第四代英特尔至强 可扩展处理器)。结果可能不同。4. 详情请见以下网址的[N10]:https://edc.intel.com/content/www/cn/zh/products/performance/benchmarks/processors/(第四代英特尔至强 可扩展处理器)。结果可能不同。5. 详情请见以下网址的[N24]:https://edc.intel.com/content/www/cn/zh/products/performance/benchmarks/processors/(第四代英特尔至强 可扩展处理器)。结果可能不同。6. 详情请见以下网址的[N60]:https://edc.intel.com/content/www/cn/zh/products/performance/benchmarks/processors/(第四代英特尔至强 可扩展处理器)。结果可能不同。7. 详情请见以下网址的[N4]:https://edc.intel.com/content/www/cn/zh/products/performance/benchmarks/processors/(第四代英特尔至强 可扩展处理器)。结果可能不同。

想看更多“芯”资讯

用你的在看告诉我们~

英特尔公司,英特尔、英特尔logo及其它英特尔标识,是英特尔公司或其分支机构的商标。文中涉及的其它名称及品牌属于各自所有者资产。

aacb3fb6-0387-11ee-90ce-dac502259ad0.png

十年铸就两项黑科技,打破Android与Windows壁垒

英特尔Flex系列GPU发布软件更新包,扩展支持Windows云游戏等新功能

探秘锐炫:游戏新势力,天生爱创作!


原文标题:使用面向网络优化的新一代处理器,实现高吞吐量与低时延

文章出处:【微信公众号:英特尔中国】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    60

    文章

    9874

    浏览量

    171366
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10816

    浏览量

    210957

原文标题:使用面向网络优化的新一代处理器,实现高吞吐量与低时延

文章出处:【微信号:英特尔中国,微信公众号:英特尔中国】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    TMS320VC5510 HPI吞吐量优化

    电子发烧友网站提供《TMS320VC5510 HPI吞吐量优化.pdf》资料免费下载
    发表于 10-16 09:35 0次下载
    TMS320VC5510 HPI<b class='flag-5'>吞吐量</b>和<b class='flag-5'>优化</b>

    TMS320C6474模块吞吐量

    电子发烧友网站提供《TMS320C6474模块吞吐量.pdf》资料免费下载
    发表于 10-15 13:52 0次下载
    TMS320C6474模块<b class='flag-5'>吞吐量</b>

    TMS320C6474通用总线架构(CBA)吞吐量

    电子发烧友网站提供《TMS320C6474通用总线架构(CBA)吞吐量.pdf》资料免费下载
    发表于 10-15 10:29 0次下载
    TMS320C6474通用总线架构(CBA)<b class='flag-5'>吞吐量</b>

    TMS320DM36x SoC架构和吞吐量

    电子发烧友网站提供《TMS320DM36x SoC架构和吞吐量.pdf》资料免费下载
    发表于 10-14 10:51 0次下载
    TMS320DM36x SoC架构和<b class='flag-5'>吞吐量</b>

    TMS320C6472/TMS320TCI6486的吞吐量应用程序报告

    电子发烧友网站提供《TMS320C6472/TMS320TCI6486的吞吐量应用程序报告.pdf》资料免费下载
    发表于 10-14 09:27 0次下载
    TMS320C6472/TMS320TCI6486的<b class='flag-5'>吞吐量</b>应用程序报告

    求助,关于使用iperf测量mesh节点吞吐量问题求解

    我把esp-mesh-lite的no-route例程和iperf例程合在起,想测试两个mesh节点间tcp通信的吞吐量,实际过程中开始流量正常,数秒后客户端发数据这边monitor卡死没有任何
    发表于 07-23 06:59

    用Iperf例程测试ESP32-C6的TCP通信,吞吐量很低的原因?

    为什么我用官网的Iperf例程测试ESP32-C6的TCP通信,吞吐量才0.33Mbps
    发表于 06-06 07:47

    宁畅B5000 G5多节点服务采用第五英特尔至强可扩展处理器

    “基于第五英特尔 至强 可扩展处理器的宁畅B5000 G5多节点服务,可以在满足大量AI推理场景在吞吐量、时、容量、并发能力等方面的需
    的头像 发表于 05-27 11:46 764次阅读
    宁畅B5000 G5多节点服务<b class='flag-5'>器</b>采用第五<b class='flag-5'>代</b>英特尔至强可扩展<b class='flag-5'>处理器</b>

    英特尔AI产品助力其运行Meta新一代大语言模型Meta Llama 3

    英特尔丰富的AI产品——面向数据中心的至强处理器,边缘处理器及AI PC等产品为开发者提供最新的优化,助力其运行Meta新一代大语言模型Me
    的头像 发表于 04-28 11:16 577次阅读

    英特尔展示新一代至强处理器网络性能,助力5G核心网节能

     Sierra Forest至强处理器于去年秋天的英特尔On技术创新大会亮相,采用纯能效核心设计,配备多达288颗Sierra Glen核芯(基于Meteor Lake上的Crestmont能效核心升级),致力于实现每瓦性能、核芯密度和
    的头像 发表于 02-27 09:51 552次阅读

    如何提高CYBT-243053-02吞吐量

    你好我们直在使用“EZ-Serial Firmware: v1.4.13.13 Sep 22 2023 10:24:41”测试“CYBT-243053-02”,我们得到的吞吐量比 PUART
    发表于 02-27 06:56

    芯原推出全新的VC9800系列视频处理器

    VC9800系列视频处理器IP具备高性能、吞吐量和服务级别的多码流编解码能力,可支持最高256路码流,并兼容所有的主流视频格式,包括新一代
    发表于 01-18 11:12 448次阅读

    兆芯推出新一代桌面处理器开先KX-7000系列

    开先 KX-7000系列处理器采用新一代的“世纪大道”自主微架构,针对内核前端设计、乱序执行引擎及执行单元、以及访存层级结构等方面,进行了全新的设计和全面的优化
    发表于 01-08 10:48 716次阅读

    GD32VW553吞吐量及场景功耗测试指南应用说明

    电子发烧友网站提供《GD32VW553吞吐量及场景功耗测试指南应用说明.pdf》资料免费下载
    发表于 12-14 10:20 1次下载
    GD32VW553<b class='flag-5'>吞吐量</b>及场景功耗测试指南应用说明

    影响ATE电源系统吞吐量的关键因素

    从串行设备测试改变为并行设备测试可以显著地增加测试系统吞吐量。测试执行活动的大部分可能涉及使用DC电源设置条件和进行测量。配置测试系统,使其能够使用多个直流电源同时对多个设备执行测试,是显著提高测试吞吐量种经济有效的方法。
    发表于 11-29 12:36 352次阅读
    影响ATE电源系统<b class='flag-5'>吞吐量</b>的关键因素