0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

拓展AI数据中心内存,第二代AMD Versal Premium系列自适应SoC,首发支持CXL 3.1、 PCIe Gen6

花茶晶晶 来源:电子发烧友 作者:黄晶晶 2024-11-14 16:39 次阅读

电子发烧友网报道(文/黄晶晶)在数据中心市场,DDR5和CXL内存正在成为广泛采用的主流趋势。预计2024年到2029年CXL内存的采用将达到212%的年复合增长率。如今,现有出货的半数服务器已经支持CXL,预计未来几年越来越多的服务器将实现对CXL的支持。

基于这一趋势,AMD宣布推出第二代AMD Versal Premium 系列,这款自适应SoC平台旨在面向各种工作负载提供最高水平系统加速。第二代 Versal Premium 系列将成为FPGA 行业首款在硬IP中采用 CXL3.1与 PCIe Gen6 并支持LPDDR5的器件。CXL 3.1 和 LPDDR5X 能助力更快速地释放更多内存,以满足数据中心、通信以及测试测量市场中数据密集型应用日益增长的实时处理和存储需求。

wKgZomc1t1qAJ7fAAAnXfN3i2s8611.png

近日,AMD自适应与嵌入式计算事业部( AECG ) Versal产品营销总监Manuel Uhm,和高级产品线经理Mike Rather与媒体交流,分享了第二代AMD Versal Premium系列自适应SoC的特点细节和应用趋势等等。

创新设计

第二代AMD Versal Premium系列产品,基于第一代产品进行了复用设计,但针对I/O、收发器以及存储/内存的控制器、主机接口都做了创新。
wKgZomc1t2iAM0vJAAZ21elMVgY587.png

AMD高管分析,DSP的计算密度方面,实现了更高的每平方毫米的DSP算力。另外引入了一个新的收发器GTM2,GTM2能够支持的数据速率从1.25 Gb/s到128 Gb/s,同时还支持NRZ和PAM4编码。保留了非常熟悉的设计流程,开发者可以使用GTM2,同时还确保全过程的可靠性。在I/O方面,增加对于高速MIPI C-PHY和D-PHY接口的支持。第二代新加入的LDPC解码器的模块适用于高通量的解码。

wKgaomc1t3SAFtNgAAMG_OaV4Ic652.png

加速主机连接

第二代 Versal Premium 器件支持业界最快的主机接口CXL 3.1和PCIe Gen6,可实现行业领先的高带宽主机CPU到加速器连接。

AMD高管表示,与主机连接使用的PCIe Gen 6和CXL 3.1都是64Gb/s的速率。与支持 PCIe Gen4或Gen5的FPGA 相比,PCIe Gen6 能提供2至4倍的线速率,而运行 PCIe Gen6 的 CXL 3.1 在类似时延下则能提供使用CXL 2.1 器件的双倍带宽,以及增强的架构和一致性功能。

在Versal Premium自适应SoC和AMD EPYC CPU之间能够形成非常好的协同。PCIe Express能够提供Versal Premium和CPU之间非常高性能的连接,这可以用于卸载计算、网络以及存储工作负载。也能拥有非常连贯的接口,这样Versal Premium和EPYC处理器就能够共享内存空间,从而减少搁置内存。再加上PCIe IDE以及内存DRAM的加密,数据能够做到端到端的安全性。

wKgZoWc1t3-ADxEBAAOYVrmcas4138.png

释放更多内存

第二代 AMD Versal Premium 系列自适应SoC能以至高8533 Mb/s的最快速LPDDR5存储器连接加速存储器带宽,带来更快速的数据传输和实时响应。与采用 LPDDR4/5 存储器的同类器件相比,这种超快的增强型DDR存储器可将主机连接速度提升至高2.7倍。

wKgaoWc1t42AYunyAAKAtN0slPM796.png

第二代产品在DDR5和LPDDR5上支持的数据速率,是第一代产品支持的DDR4和LPDDR4的2倍。而且DDR5和LPDDR5相比DDR4和LPDDR4,消耗的功率有20%到30%的下降。

AMD高管表示,第一代Versal Premium系列产品关注的是在高安全性、高通量和带宽的情况下加速网络。第二代AMD Versal Premium除了像第一代那样加速400G或者800G的网络之外,增加了支持CXL内存的分享和池化,因为我们发现在数据中心需要越来越多的内存来支持大语言模型。

也可以说,第二代AMD Versal Premium助力计算,是通过更好地管理系统的内存,这正是现在人工智能模型以及各种数据集成最需要的。

支持CXL 3.1存储器扩展模块方面,专门针对CXL 3.1规范设计的存储接口,可以和各家供应商的DRAM实现兼容。至高 256x8.533 Gb/s 的 LPDDR5X存储器带宽,至高 16x 64 Gb/s 的 PCle Gen6 带宽,使得总外部存储器带宽超过500 GB/S。

wKgaoWc1t5yAFvR2AAMvMjdHXoA142.png

增强数据安全

在不断变化的安全形势下,增强数据安全性正变得日益重要。增强的安全功能有助于第二代 Versal Premium 系列在传输和静态状态下均可快速、安全地传输数据。其是业界首款在硬 IP 中提供集成 PCIe完整性和数据加密( IDE )支持的 FPGA 器件。硬核 DDR 内存控制器内置的内联加密可助力保护静态数据,而 400G 高速加密引擎则能帮助器件以至高 2 倍的线速率保护用户数据,从而实现更快速的安全数据事务。有了PCIe IDE加上高速加密引擎、DDR内联加密与ECC,数据无论是在传输中、静态中、还是使用中都非常的安全。

应用

在给出的应用案例中,第二代产品能够扩大数据中心的CXL应用范围,CXL 3.1采用PCIe Gen 6协议,可以利用NUMA轻松与现有的软件集成。

操作模式方面,能够支持CXL.io、CXL.mem、CXL.cache。器件模式方面,第二代 Versal Premium 可以作为内存的控制器,也可以使用主机模式,连接CXL扩展模块。在用例方面,支持多主机单逻辑设备(MH-SLD)架构和系统可组合性。

wKgZoWc1t6eAd9KIAAKrg-s2nNo109.png

自适应网络用于GPU集群和横向扩展方面,很多客户都会购买并部署GPU集群,而标准的网络接口却未必能够支持在这样情境下GPU的性能和灵活性。而第二代AMD Versal Premium能够提供很高的带宽和灵活性,实现这方面的应用需求。“这个应用我们在Virtex UltraScale+ 和第一代Versal Premium也都支持过,但是现在第二代AMD Versal Premium系列能够在单个网络适配器上支持2个400G接口。”AMD高管说道。

wKgaoWc1t7SAJFitAAMqNpLQA-w828.png

在测试与测量领域,开发PCIe Gen 7器件时测试仪器需求128 Gb/s的收发器,这些应用非常重视芯片上的DSP引擎以及内存带宽和其他的接口能力。另外第二代AMD Versal Premium系列支持测试设备需要的C-PHY和D-PHY等协议。

wKgaoWc1t7-AJtMrAAfuD7kgmuA966.png

工具和量产时间

AMD也在不断地改善Vivado的开发环境,通过采用新的P&R算法,并且改善多线程的性能,增强的增量流,从而减少编译时间。引入了用于顶层设计的RTL流程,以及用于GTM2的RTL流程等。改善QoR与易用性,通过工具引导的时序收敛,改进的DFX流程,以及分段配置以便加快CPU启动时间和PCIe的唤醒。

wKgaoWc1t8qAUy-YAAhWl0-9Vuk013.png
第二代AMD Versal Premium系列产品表显示有4种产品。从140万逻辑单元到330万逻辑单元不等,从3300到7600的DSP引擎不等,GTM2收发器从32个到72个不等,片上内存、100G/600G以太网MAC、400G高速加密引擎、LDPC解码器等也各有不同。

wKgaomc1t9mAOyhTAAJRJqXBrLI494.png

第二代AMD Versal Premium系列已经向开发者提供早期文档,AMD将于2024年第四季度提供功率估算工具,2025年下半年提供全套的AMD Vivado工具。2026年上半年将提供芯片的样片以及开发套件,2026年中实现芯片量产。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    29892

    浏览量

    268185
收藏 人收藏

    评论

    相关推荐

    AMD推出第二代Versal Premium系列

    近日,AMD(超威,纳斯达克股票代码:AMD )今日宣布推出第二代 AMD Versal Premium
    的头像 发表于 11-13 09:27 191次阅读

    AMD第二代Versal自适应SoC的主要特色

    AMD 第二代 AMD Versal AI Edge 和 Versal Prime
    的头像 发表于 09-18 10:14 401次阅读

    AMD Versal自适应SoC CPM5 QDMA的Tandem PCIe启动流程介绍

    本文将从硬件设计和驱动使用两个方面介绍基于 CPM5 QDMA 的 AMD Versal 自适应 SoC 的 Tandem 设计和启动流程。
    的头像 发表于 09-18 10:07 373次阅读
    <b class='flag-5'>AMD</b> <b class='flag-5'>Versal</b><b class='flag-5'>自适应</b><b class='flag-5'>SoC</b> CPM5 QDMA的Tandem <b class='flag-5'>PCIe</b>启动流程介绍

    第二代AMD Versal Prime系列自适应SoC的亮点

    第二代 Versal Prime 系列自适应 SoC 是备受期待的 Zynq UltraScale+ MPSoC 产品线的继任产品,该产品线
    的头像 发表于 09-14 15:32 302次阅读
    <b class='flag-5'>第二代</b><b class='flag-5'>AMD</b> <b class='flag-5'>Versal</b> Prime<b class='flag-5'>系列</b><b class='flag-5'>自适应</b><b class='flag-5'>SoC</b>的亮点

    美光研发出世界首款PCIe Gen6 SSD

    了全球最快的数据中心SSD——9550系列PCIe Gen5 SSD。值得注意的是,PCIe Gen6
    的头像 发表于 08-07 17:16 678次阅读

    AI与开源力推嵌入式系统创新升级

    AMD在此次展会上宣布扩大AMD Versal自适应片上系统(SoC)产品线,推出全新第二代
    的头像 发表于 04-29 11:11 458次阅读

    AMD发布第二代Versal自适应SoCAI嵌入式领域再提速

    AMD表示,第二代Versal系列自适应SoC搭载全新的AI
    的头像 发表于 04-11 16:07 735次阅读

    AMD Versal SoC刷新边缘AI性能,单芯片方案驱动嵌入式系统

    宣布扩展 AMD Versal自适应片上系统( SoC )产品组合,推出全新第二代 Versal
    的头像 发表于 04-11 09:06 3658次阅读
    <b class='flag-5'>AMD</b> <b class='flag-5'>Versal</b> <b class='flag-5'>SoC</b>刷新边缘<b class='flag-5'>AI</b>性能,单芯片方案驱动嵌入式系统

    AMD推出第二代Versal器件,为AI驱动型嵌入式系统提供端到端加速

    Versal AI Edge 系列第二代 Versal Prime 系列
    的头像 发表于 04-10 10:25 1063次阅读

    AMD Versal SoC全新升级边缘AI性能,单芯片方案驱动嵌入式系统

    宣布扩展 AMD Versal自适应片上系统( SoC )产品组合,推出全新第二代 Versal
    的头像 发表于 04-09 21:32 990次阅读
    <b class='flag-5'>AMD</b> <b class='flag-5'>Versal</b> <b class='flag-5'>SoC</b>全新升级边缘<b class='flag-5'>AI</b>性能,单芯片方案驱动嵌入式系统

    AMD 以全新第二代 Versal 系列器件扩展领先自适应 SoC 产品组合,为 AI 驱动型嵌入式系统提供端到端加速

    股票代码:AMD)今日宣布扩展 AMD Versal自适应片上系统( SoC )产品组合,推出全新
    发表于 04-09 16:50 3787次阅读
    <b class='flag-5'>AMD</b> 以全新<b class='flag-5'>第二代</b> <b class='flag-5'>Versal</b> <b class='flag-5'>系列</b>器件扩展领先<b class='flag-5'>自适应</b> <b class='flag-5'>SoC</b> 产品组合,为 <b class='flag-5'>AI</b> 驱动型嵌入式系统提供端到端加速

    瑞芯微第二代8nm高性能AIOT平台 RK3576 详细介绍

    ArmSoM-Sige5采用Rockchip 第二代8nm高性能AIOT处理器 RK3576,主频高达2.2GHz,6 TOPS算力NPU , 支持ufs ,双USB,双网口,全功能typec,兼容树莓派40pin arms
    发表于 03-12 13:45

    【ALINX 技术分享】AMD Versal AI Edge 自适应计算加速平台之 Versal 介绍(2)

    【ALINX 技术分享】AMD Versal AI Edge 自适应计算加速平台之 Versal 介绍,以及
    的头像 发表于 03-07 16:03 953次阅读
    【ALINX 技术分享】<b class='flag-5'>AMD</b> <b class='flag-5'>Versal</b> <b class='flag-5'>AI</b> Edge <b class='flag-5'>自适应</b>计算加速平台之 <b class='flag-5'>Versal</b> 介绍(2)

    AMD率先推出符合DisplayPort™ 2.1 8K视频标准的FPGA和自适应SoC

    AMD UltraScale+ FPGA 和 AMD Versal 自适应 SoC 产品系列已率
    的头像 发表于 01-24 09:18 428次阅读

    Versal 自适应SoC设计指南

    电子发烧友网站提供《Versal 自适应SoC设计指南.pdf》资料免费下载
    发表于 12-14 16:22 1次下载
    <b class='flag-5'>Versal</b> <b class='flag-5'>自适应</b><b class='flag-5'>SoC</b>设计指南