0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Pensando:AMD在数据中心网络领域的野望

sakobpqhz 来源:算力基建 2023-09-14 16:56 次阅读

01. Pensando的前世

Pensando创立于2016年,创始人为从Cisco离职的4位大佬级人物:Mario Mazzola、Prem Jain、Luca Cafiero和Soni Jiandani。他们的名字可能你不熟悉,但是他们提出的协议MPLS你一定不陌生(MPLS一说是取自他们的名字首字母),对这4位大神有兴趣的话后台私信我。这4位大佬在Cisco离职之后,创办了Pensando。可以说这是一家小而精的公司,其客户覆盖了高盛、NetApp、Equinix、HPE,从国际投行,到存储和数据中心巨头,明显看得出来,客户都是精挑细选,非常有针对性。

“它是一个软件定义的分布式服务平台,针对边缘进行加速,始终安全,并面向云、企业以及服务提供商客户”。

2019年10月,Pensando宣布Chambers担任董事会主席,而这位Chambers,历任Cisco,JC2 Ventures投资机构CEO,圈内地位可见一斑。

02. Pensando的今生

2022年4月,AMD宣布以19亿美元收购DPU初创公司Pensando。如果说ZEN架构让AMD翻身成功,那么收购Pensando,可以说是AMD在技术方面补齐了数据中心拼图的最后一块短板,个人认为,此举不亚于NVIDIA在2019年收购互连芯片独角兽厂商Mellanox。如果说Mellanox是打通了NVIDIA的GPU在数据中心中集群互连的任督二脉,那么AMD收购Pensando,也彰显了其在加深计算(X86+Radeon)与数据处理(DPU)壁垒的野望。

Pensando产品上线之前的资料非常少,非常低调。目前根据AMD官网等网站资料显示,最新的Pensando产品为“Giglio ”DPU。Giglio,是基于第二代AMD Pensando “Elba” DPU的一个功耗和性能优化芯片。它与其前身源代码兼容,方便客户替换和扩展。

03. Pensando的特性

Pensando可以在2 x 200Gb/s线速下提供了卸载各种数据中心网络、存储和安全服务的高级功能。它采用了一个由144个自定义匹配处理单元(MPU)组成的可编程P4流水线,与一个16x A72 ARM内核的组合,以及专用的数据加密和存储卸载引擎,所有这些都通过专有的快速网络芯片互连在一起。Giglio独特的体系结构允许客户以虚拟化、分布式且集中管理的方式创建高效、可扩展的解决方案,以部署丰富的软件定义的网络、存储和安全功能集。

Giglio DPU允许实现复杂的流量处理和转发算法,包括网络虚拟化和安全性、数据包封装/解封装、内联加密/解密和网络地址转换。

Giglio DPU架构支持状态处理,可用于流监控、数据流感知安全策略实现、抵御DDoS攻击等。

专用的卸载引擎可以无缝高效地处理各种加密和存储算法中使用的计算繁重的操作,包括压缩/解压缩、校验和、RAID和重复数据删除哈希。

AMD Pensando DPU使用行业标准P4语言进行编程,有助于实现各种系统解决方案。它支持软件定义的网络和存储协议,包括NVMe虚拟化和传输,并且其设计使开发人员能够开发和部署新功能及修改以满足产品生命周期中不断变化的客户需求。

Giglio DPU的形式因素和功耗配置旨在支持多种系统级实现,范围从半高半长PCIe卡(可适合任何标准服务器的功率和制冷配置文件)到网络和安全设备及智能交换机。P4可编程设计使这些应用程序能够动态重新配置DPU内的数据处理。

8642c312-52ab-11ee-a25d-92fbcf53809c.png

Giglio DPU提供以下可配选项

86776a5e-52ab-11ee-a25d-92fbcf53809c.png

Giglio DPU一些典型使用场景

868fc86a-52ab-11ee-a25d-92fbcf53809c.png

04. Pensando的细节

根据目前可查到的比较详细资料是来自Hot chips21的一篇paper,我们可以通过这篇paper来探讨一下Pensando的内部架构细节

86b5eb3a-52ab-11ee-a25d-92fbcf53809c.png

Asic block diagram

如上图所示,Pensando架构可以大体上分为两个部分,绿色的是内存事务层面,蓝色的可以认为是网络数据层面。

数据路径

从网络进入的数据包会在一个以太网MAC接口上被接收,并根据L2或L3服务类型(COS)被放入数据包缓冲区。数据包缓冲区提供“暂停吸收缓冲”和面向COS的仲裁,为P4入口流水线服务。与P4模型一致,数据包首先通过P4入口流水线进行流分类;如有组播或SPAN复制则返回数据包缓冲区;然后进入P4出口流水线应用例如网络地址转换、遥测等。完成网络处理任务后,数据包可以被发送回以太网MAC端口,或者传递到ARM子系统或本地主机。

如果数据包被发送到ARM或本地主机,它必须根据ARM上运行的内核或用户态驱动程序的需要进行处理。数据包通过第三个P4流水线,在那里它根据数据包的协议类型(以太网、RDMA、NVMe或新协议)运行另一个程序。与面向特定内核或用户驱动程序的协议特定P4程序相关联的一个重要优势是能够根据目标驱动程序的需求自定义描述符格式、完成事件、中断方案和数据格式。

总之,网络数据包进入ASIC,通过P4入口和出口流水线应用安全性和网络服务,与目标接口和设备类型相关联,并通过P4驱动程序接口程序传递。最终的数据包或数据缓冲区被传递到连接的主机、嵌入式ARM或集成的卸载引擎。主机发送的数据包通过PCIe MAC进入,由P4驱动程序接口程序处理,然后由P4入口和出口流水线处理以应用安全和网络服务,之后通过以太网MAC发送出去。

硬件队列管理

从网络进入P4流水线的数据包或来自内部事件的数据包被放入硬件队列。硬件队列用于管理接口、数据流、连接和任何其他需要有序跟踪和调度的对象。软件可以配置高达1600万个硬件队列。每个队列在基于DRAM的qstate记录中存储其当前状态,包括已入队对象的计数、指向入队对象数组或链接列表的指针、连接状态和对等信息,以及用于内存保护的进程ID。

使用doorbell机制触发通知入队新对象的事件,允许使用单个门铃动作将一个或多个对象添加到任何队列。队列调度器将所有1600万个队列组织到一个DRAM数组中,提供优先级调度、最小/最大数据速率和加权轮询调度可跨调度组使用。当调度一个队列时,一个带有已调度队列ID和COS的PHV令牌被插入到分配的P4流水线进行处理。然后,TE访问qstate数组,根据队列类型和状态启动程序,这反过来从P4程序中的表中获取排队的对象和描述符。

86d6206c-52ab-11ee-a25d-92fbcf53809c.png

Sixteen million queues

中心数据包缓冲区

多个独立的P4流水线通过一个中心数据包缓冲区相互连接。数据包缓冲区是一个共享内存式交换架构,对多个服务等级具有虚拟输出队列以及增强的传输选择调度。组播复制、SPAN(交换机端口分析器)队列和网络暂停缓冲由中心数据包缓冲区提供。此外,入口数据包突发溢出特性允许短期突发写入DRAM内存的溢出区域。中心数据包缓冲区在数据包域中运行,而系统级芯片(SOC)在内存事务域中运行。P4 DMA引擎桥接这两个域,将数据包转换为内存事务。

PCIe端口和虚拟化

PCIe虚拟化硬件允许在SOC上运行的软件配置呈现给主机的设备数量和类型,包括配置空间、BAR范围和虚拟功能计数。这允许向不同进程呈现和附加多个网络、存储和主机可见的卸载设备。PCIe通道可以分叉为多个端口,每个端口可以作为虚拟端点交换机或root complex运行。如果配置了多个虚拟交换机端口,则多个主机可以通过单独的PCIe通道附加并共享网络服务,就像它们属于每个主机本地一样。内部ASIC COS缓冲资源在主机之间实施公平的隔离,防止影响相邻主机。另一方面,如果将PCIe端口配置为root complex,则存储设备(如NVMe驱动器)由SOC控制并虚拟化到本地和远程主机。其他PCIe设备包括GPU和机器学习加速器也可以由ASIC控制。

86f59e10-52ab-11ee-a25d-92fbcf53809c.png

前两代ASIC的性能

性能

上表展示了前两代Pensando的性能,场景包括每个连接的状态防火墙、每个流的遥测收集,以及ARM CPU管理连接建立/拆除而数据通路操作在P4流水线中处理。延迟和抖动是通过实验室测试设备在线路上测量的。

与可用解决方案进行比较很困难,因为很少有发布具有相同服务特征的结果,但提供这些功能子集的解决方案显示其交付的百万数据包/秒 (MPPS) 仅为Pensando的一小部分。Pensando的每秒连接建立和跟踪性能比可用解决方案高一个数量级,并接近大型多端口服务设备。

05. CONCLUSION

现代数据中心正面临着在安全性、网络、遥测、存储和规模方面的需求,这些需求当前设备无法解决。Pensando开发了一个分布式服务架构来解决这些数据中心需求,同时基于针对特定领域的、开源的、许可宽松的P4语言提供了用户可编程性。第一个两代架构以16nm和7nm工艺实现为ASIC。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5469

    浏览量

    134190
  • 数据中心
    +关注

    关注

    16

    文章

    4782

    浏览量

    72141
  • 源代码
    +关注

    关注

    96

    文章

    2945

    浏览量

    66755

原文标题:Pensando : AMD在数据中心网络领域的野望

文章出处:【微信号:算力基建,微信公众号:算力基建】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    再下一城,AMD收购DPU厂商,补齐数据中心业务拼图

    AMD在数据中心领域的布局更加完善。   根据报道,该笔交易预计将在今年第二季度完成。   Pensando由四位前思科工程师创立于2017年,该公司是一家数据中心服务商,产品主要是
    的头像 发表于 04-07 07:29 2774次阅读

    锐捷网络中标中国联通数据中心集采项目

    ,在互联网、金融等数据中心建设需求强劲的重要领域取得了累累硕果。锐捷网络参与了阿里巴巴、腾讯、百度、奇虎360、中国建设银行、中国邮政储蓄银行、北京银行等不同规模数据中心
    发表于 01-24 10:14

    易天重点解析监控系统在数据中心机房的重要性

    ,通过在数据中心机房内多个区域部署温湿度传感器,建立起温湿度的监控网络,就可以及时地发现局部区域过温过湿的情况,在一些空气污染较为严重的地方,还可以部署空气清洁度监测的设备,数据中心机房设备运行在污染
    发表于 10-09 15:00

    在数据中心应用MPO/MTP光缆的七大优势

    家庭、物联网等诸多领域。而在5G的铺设中,光纤光缆的需求量也将随之快速增长,其中,拥有优势的MPO/MTP光缆也开始获得了更多人的关注。本文就来细数MPO/MTP光缆在5G数据中心上的优势所在。在数据中心应用MPO/MTP光缆的
    发表于 01-05 06:10

    数据中心太耗电怎么办

    !》,原文作者:启明 。一、3 年电费消耗,可再建造一个数据中心!1.1 科技驱动,推动数据中心市场持续高速发展国际惯例,先介(bai)绍(du)一(bai)下(ke)“数据中心”:数据中心
    发表于 06-30 06:27

    数据中心是什么

    数据中心是什么:数据中心是全球协作的特定设备网络,用来在因特网络基础设施上传递、加速、展示、计算、存储数据信息。
    发表于 07-12 07:10

    AMD斥资19亿美元收购云计算企业Pensando

    近日,AMD公司正式发布声明称将斥资19亿美元收购云计算初创公司Pensando,以加强其数据中心产品,满足云计算和企业领域不断增长的市场需求,能帮助企业客户和
    的头像 发表于 04-06 09:43 1542次阅读

    AMD宣布将收购DPU芯片厂商Pensando

    电子发烧友网报道(文/李弯弯)近日,AMD宣布将收购DPU芯片厂商Pensando,花费19亿美元,约合121亿元人民币。这是AMD成功收购FPGA芯片厂商赛灵思之后,又一笔收购,而这笔收购将使得
    的头像 发表于 04-08 08:13 1406次阅读

    智能照明控制系统在数据中心的应用

    智能照明系统逐渐在数据中心设计和建设中落地,且应用场景不断丰富,同时也逐步在数据中心改造中进行体现。结合数据中心照明系统的实际案例,分析不同的照明模式的优缺点,为数据中心智能照明的应用
    发表于 05-19 09:13 1008次阅读
    智能照明控制系统<b class='flag-5'>在数据中心</b>的应用

    智能照明控制系统在数据中心的应用

    【摘要】:智能照明系统逐渐在数据中心设计和建设中落地,且应用场景不断丰富,同时也逐步在数据中心改造中进行体现。结合数据中心照明系统的实际案例,分析不同的照明模式的优缺点,为数据中心智能
    发表于 06-27 09:25 615次阅读
    智能照明控制系统<b class='flag-5'>在数据中心</b>的应用

    数字孪生在数据中心的应用场景

    数字孪生技术如何应用到数据中心的运营发展,又在数据中心的设计与发展阶段起到怎样的作用呢?本文将在数据中心的设计阶段与运维阶段应用数字孪生技术进行解析。
    的头像 发表于 08-28 15:03 1691次阅读
    数字孪生<b class='flag-5'>在数据中心</b>的应用场景

    集中电源控制器在数据中心的应用

    集中电源控制器在数据中心的应用非常广泛。数据中心通常需要大量的电源来支持服务器、网络设备和存储设备等关键基础设施的运行。集中电源控制器可以提供稳定、可靠的电源供应,确保数据中心的正常运
    的头像 发表于 01-30 15:24 508次阅读
    集中电源控制器<b class='flag-5'>在数据中心</b>的应用

    多业务光端机在数据中心的应用:提升网络效率的关键

    网络效率方面的作用不可忽视。 一、多业务光端机在数据中心的应用 在数据中心中,多业务光端机主要承担以下任务: 高速数据传输 :数据中心内部需
    的头像 发表于 02-23 14:09 664次阅读

    AMD数据中心业务收入超越Intel

    AMD在2024年第三季度的财务报告中,展示了其在数据中心业务领域的重大突破。据报告显示,AMD数据中心业务收入达到了35.49亿美元,同
    的头像 发表于 11-07 11:10 388次阅读

    史上首次,AMD在数据中心市场的销售额超过了英特尔!

    一,引言   “在超过二十年的时间里,AMD首次在数据中心领域超越了英特尔公司的销售额!” 在数据中心CPU市场,Intel®曾长期占据霸主地位,其Xeon处理器支撑着绝大多数服务器。然而,这一
    的头像 发表于 11-19 14:51 247次阅读
    史上首次,<b class='flag-5'>AMD</b><b class='flag-5'>在数据中心</b>市场的销售额超过了英特尔!