0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于Gen-Z语义存储(memory-semantic)体系架构探讨

454398 来源:电子技术设计 作者:Gary Hilson 2020-10-23 15:38 次阅读

不要与人口学中的千禧世代搞混了,Gen-Z是一种语义存储(memory-semantic)体系架构,它已经发展到了一定程度,需要更好地定义来适应更大规模的规范与标准,例如在数据中心越来越受欢迎的成熟NVM Express和新兴Compute Express Link(CXL)协议。

Gen-Z使用语义存储通信,以最小开销在不同组件的内存之间传送数据,它不仅使存储器件互连,也使处理器和加速器互连,加速器可以减轻CPU的处理压力,越来越受到存储和人工智能等应用的青睐。Gen-Z在资源供应和共享方面更灵活、响应更快,当应用所需资源发生变化时,可以重新配置系统。

与许多体系架构一样,在支持和增强现有系统方面,Gen-Z会尽量使其达到平衡,同时还可以创建新的体系架构。Gen-Z架构强调要弄清谁在做什么。研究机构Coughlin and Associates的总裁Thomas Coughlin说:“这个问题令人困扰,很多事情他们可能都在做重复工作,如果能互通有无,搞清谁在做什么和如何做,并且一起去做,那就太好了。”

Gen-Z之所以能成为主流,一个重要原因就是可以支持不同类型标准化设备的互操作性,其他体系架构(如CXL)的支持者也认同协作的重要性。

“人们采用不同的方式创建网络及包含各种要素(如联网、存储和计算,以及加速器)的架构,我们认为所有这些方式之间的关系都需要讨论清楚。”Coughlin说,“如何使所有这一切协同工作?如何创建最佳的网络和架构,使它们尽可能以有效的方式在本地和远程工作?对NVMe over Fabric与Gen-Z进行区分只是其中的一个例子。”

图1:Gen-Z架构的开发重点是通过下一代器件(如持久性内存)的透明集成实现持续的性能提升,并通过组合式存储器和加速器来充分利用DRAM。(图片来源:Gen-Z联盟)

Gen-Z联盟声称,Gen-Z本身的主要技术优势是能够将DRAM和非易失性存储器及未来的持久性存储技术结合起来,它还使用一种高带宽、低延迟和高效的协议来简化软硬件设计,降低了解决方案的成本和复杂性。与任何新的体系架构一样,Gen-Z的目标是在不降低系统性能的情况下可以灵活扩展,同时保持设计兼容性,以集成到现有平台并与任何必需的软件兼容。

“为实现这一架构,大家必须合作,因此Gen-Z联盟与OpenFabrics联盟(OFA)签署了合作意向书(MOU)。”Gen-Z联盟主席Paul Grun表示,合作对双方都有利。Gen-Z需要在整个架构拓扑上实现类似存储的语义,帮助Gen-Z实现分布式存储架构;OFA的目标则是加速OFA的发展并推进新结构的采用,以形成良好的网络生态系统。“很明显,Gen-Z是下一代架构。”他接着说,但OFA不是标准机构,而是开发者。“我们为他们提供所需的软件来加速架构的开发和采用。”

架构所采用的先进软件可以是任何适合当前和未来高性能计算、云服务和企业级数据中心的API及相关软件,在需要高效联网、超低延迟、更快的存储连接、可扩展并行计算和云服务的场景中使用。Grun说,OFA与具体的架构和供应商无关,它主要关注作为OpenFabrics接口(OFI)一部分的用户模式API(称为libfabricAPI),并对需要公共管理框架的组合式异构网络进行网络管理。

Grun提到,最近宣布的合作意向书拟定,OFA将为Gen-Z提供libfabric程序,使支持libfabric的任何应用或中间件都能轻松使用Gen-Z功能,OFA同时还将研究对libfabric API进行增强的可能性。Gen-Z将是首个用于管理组合式网络的解决方案,这一方案使用DMTF的Redfish标准,由管理框架、“抽象”的架构管理器和特定架构的插件组成。

图2:Gen-Z可以集成到处理器中,而不会影响传统的存储控制器。例如,DDR存储控制器仍将独立为处理器的一部分地址空间提供服务,Gen-Z则将独立为另一部分服务。(图片来源:Gen-Z联盟)

Bowman说,有一些器件,如存储器、高速GPU等,在任何现有的架构上都不能很好地工作,而是需要适合自己的高速率、低延迟安全架构,Gen-Z则反映了这些器件对行业标准架构的需求。他说:“我们发现DDR接口的引脚太多了,希望能够实现一些器件民主,避免所有事务都必须由主机CPU处理。”

Bowman说,作为一种语义存储协议,Gen-Z可通过GPU、AI器件或FPGA等加速器(而非CPU)简单地读写存储空间并获取信息,同时还可以访问本地存储器和Gen-Z上的存储器。“这样,不同的器件就可以共享内存——内存可以分配给器件,也可以由多个器件共享。”

Gen-Z联盟称Gen-Z架构在连接器件和共享内存时表现出极低的延迟,但是速率不如直连到内存快。“从我们的一个演示可以看出,与Gen-Z连接的存储器件延迟降低了5倍,可与一些最快的NVMe器件通信。”他说,目前有两种方法连接到Gen-Z。一种方法是在端点设备中使用本机接口,另一种方法是采用直连到Gen-Z接口的FPGA。

当然,Gen-Z不仅需要适应OFA的发展,也要配合其他架构(如刚起步的CXL和成熟的NVMe over Fabric)的进步。但是正如Grun所指出的,由一家公司来开发其中任何一种架构的成本都太高。如同不应再将存储器和联网分开考虑,所有这些架构也都需要关联在一起。“我认为它就像一张拥有很多重要织线的大挂毯。”
编辑:hfy

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10862

    浏览量

    211727
  • 加速器
    +关注

    关注

    2

    文章

    799

    浏览量

    37863
  • 数据中心
    +关注

    关注

    16

    文章

    4776

    浏览量

    72120
  • 异构网络
    +关注

    关注

    0

    文章

    19

    浏览量

    9230
  • 非易失性存储器

    关注

    0

    文章

    107

    浏览量

    23441
收藏 人收藏

    评论

    相关推荐

    【半导体存储关于NAND Flash的一些小知识

      前言   作为一名电子专业的学生,半导体存储显然是绕不过去的一个坎,今天聊一聊关于Nand Flash的一些小知识。   这里十分感谢深圳雷龙发展有限公司为博主提供的两片CS创世SD NAND
    发表于 12-17 17:34

    利用VLM和MLLMs实现SLAM语义增强

    (VLM)和多模态大语言模型(MLLMs)来强化此类环境中的对象级语义映射。 • 文章: Learning from Feedback: Semantic Enhancement for Object
    的头像 发表于 12-05 10:00 154次阅读
    利用VLM和MLLMs实现SLAM<b class='flag-5'>语义</b>增强

    图像语义分割的实用性是什么

    图像语义分割是一种重要的计算机视觉任务,它旨在将图像中的每个像素分配到相应的语义类别中。这项技术在许多领域都有广泛的应用,如自动驾驶、医学图像分析、机器人导航等。 一、图像语义分割的基本原理 1.1
    的头像 发表于 07-17 09:56 430次阅读

    图像分割与语义分割中的CNN模型综述

    图像分割与语义分割是计算机视觉领域的重要任务,旨在将图像划分为多个具有特定语义含义的区域或对象。卷积神经网络(CNN)作为深度学习的一种核心模型,在图像分割与语义分割中发挥着至关重要的作用。本文将从CNN模型的基本原理、在图像分
    的头像 发表于 07-09 11:51 894次阅读

    三星Galaxy Z折叠屏手机无Exynos版本:均搭载骁龙8 Gen

    据悉,即将面世的Galaxy Z Flip 6及Galaxy Z Fold 6两款折叠屏手机均搭载骁龙8 Gen 3处理器,无Exynos版本。消息人士指出,三星在折叠屏手机领域选择高通处理器,主要是出于与高通的紧密合作关系以及
    的头像 发表于 05-22 14:22 460次阅读

    存内计算芯片的基石-存储介质汇总

    作为新的计算架构,存内计算(Computing In Memory,CIM)被认为是具有潜力的革命性技术。重点是将存储与计算融合,有效克服冯·诺依曼架构瓶颈,并结合后摩尔时代先进封装、
    的头像 发表于 05-16 15:41 1867次阅读
    存内计算芯片的基石-<b class='flag-5'>存储</b>介质汇总

    交换板设计方案原理图:473-SRIO_Switch_Gen2_ZD交换板卡

    SRIO_Switch_Gen2_ZD交换板卡为基于IDT SRIO Gen2系列SRIO交换芯片,采用CPCI-ZD平台架构的数据交换板。可以为高速实时信号处理任务提供可靠保障。
    的头像 发表于 05-13 11:40 827次阅读
    交换板设计方案原理图:473-SRIO_Switch_<b class='flag-5'>Gen</b>2_ZD交换板卡

    技嘉Z790 S DDR4主板适配14/13/12代酷睿CPU,并支持5333MHz内存

    在PCIe与存储方面,该主板配置了一条PCIe Gen4x16主插槽以及两条x16物理规格的PCIe Gen3x1插槽;同时,Z790 S DDR4主板还配备了三个PCIe
    的头像 发表于 05-07 15:31 3489次阅读

    数字孪生关键技术及体系架构

    的可行思路。首先介绍了数字孪生的演进与价值,然后给出了数字孪生典型特征及其体系架构,并基于该架构介绍了多项数字孪生关键技术,最后对数字孪生进行了展望,包括其面临的挑战与未来发展趋势。 01 概述 数字孪生中“孪生
    的头像 发表于 04-02 14:21 779次阅读

    嵌入式微处理器的体系结构

    嵌入式微处理器的体系结构通常包括核心架构、指令集架构存储体系架构和系统总线
    的头像 发表于 03-29 11:48 902次阅读

    罗彻斯特携手Intelligent Memory提供传统DRAM和NAND存储解决方案

    罗彻斯特电子与Intelligent Memory携手合作,确保为工业应用和嵌入式应用提供传统和成熟的DRAM和NAND存储解决方案。
    的头像 发表于 03-27 09:59 432次阅读

    NAND存储种类和优势

    非易失性存储器芯片又可分为快闪存储器 (Flash Memory) 与只读存储器 (Read-Only Memory)。其中,快闪
    发表于 03-22 10:54 879次阅读
    NAND<b class='flag-5'>存储</b>种类和优势

    OpenVINO™协同Semantic Kernel:优化大模型应用性能新路径

    作为主要面向 RAG 任务方向的框架,Semantic Kernel 可以简化大模型应用开发过程,而在 RAG 任务中最常用的深度学习模型就是 Embedding 和 Text completion,分别实现文本的语义向量化和文本生成
    的头像 发表于 03-08 10:41 706次阅读
    OpenVINO™协同<b class='flag-5'>Semantic</b> Kernel:优化大模型应用性能新路径

    【RISC-V开放架构设计之道|阅读体验】学习处理器体系架构的一本好书

    感谢电子发烧友论坛和电子工业出版社提供的试读机会。 《RISC-V开放架构设计之道》由RISC-V架构的作者、著名的计算机体系架构专家David Patterson亲自主笔撰写。Dav
    发表于 01-23 20:08

    关于修复烘缸轴磨损的探讨

    电子发烧友网站提供《关于修复烘缸轴磨损的探讨.docx》资料免费下载
    发表于 01-05 09:18 0次下载