机器学习和大数据应用正在彻底改变处理数据的方式。整个行业需要找到在保持低功耗的同时,提高计算性能的途径。对于当前的许多计算任务,连接处理器的专用硬件加速器完成该任务的速度和功耗都要比独立工作的处理器出色。
PCI Express是当前在处理器和片外加速器之间移动数据最常用的协议。但在 15 年前推出 PCI Express 时,现在的片外加速应用还没有出现,因此 PCI Express 并未针对大量这些计算工作负载进行优化。而对优化工业标准互联的需求已日益凸显。要想取得成功,新标准必须为非专有的,必须针对当前的加速器工作负载进行优化,必须尽量利用现有技术降低成本,加速产品上市进程。
考虑一下 CCIX 吧
CCIX (缓存一致互联协议)是基于现有的 PCI Express 物理层及链路层的协议,可帮助各公司充分利用其在 PCI Express 上的现有投资。同时,CCIX 还可通过未来 PCI Express 链路速度及数据链路层更新获得巨大优势。此外,CCIX 还通过在 PHY 和 CCIX 上添加可选 20 和 25 GT/S 速度扩展了现有 PCIe 的速度,并针对当前加速工作负载优化了数据链路层和事务处理层。
CCIX 可通过不同的方式简化和加速数据移动。第一种方式是使用高速缓存一致性来自动保持处理器和加速器存储器的高速缓存一致性,从而实现易用性并降低时延。由于数据是通过CCIX 协议自动同步的,因此只需将数据指针传递至加速器,而无需依靠复杂的直接存储器访问 (DMA) 驱动程序移动数据。CCIX请求代理将首先访问高速缓存,以查看所需数据是否可用,如果不可用,它就会自动从 CPU高速缓存或系统内存中获取数据。
CCIX协议能够减轻软件开发者的负担,使他们可以专注于自己的应用,而不是加速器和主处理器之间移动数据的底层机制。
CCIX可以提供帮助的第二种方式是启用存储器扩展。位于主CPU 旁边的 DIMM 插槽需求量大吗?但某些依靠新服务器类内存的应用,如持久性内存?即使在断电时,内存也不会丢失数据。CCIX允许 CPU 上的本地代理管理远程设备上的从属代理,从属代理可以控制存储类内存,然后再接入 CPU 的标准 NUMA 内存映射,从而实现这个解决方案。这导致存储类内存看起来就像常规系统内存,但具有启用任何唯一内存的属性。
最后,CCIX允许本地代理驻留在加速器上。该本地代理可管理直接连接到加速器上的存储器。通过这种方式,如果发生高速缓存丢失,驻留在加速器上的请求代理会将时延损失降到最低,但数据直接连接到加速器进行存储。
Xilinx CCIX 方案展示
赛灵思目前正在寻找有兴趣使用 CCIX的客户。现在,我们与从事 CCIX 工作的少数合作伙伴正进行合作。CCIX支持 Virtex UltraScale+ HBM 器件以及 Alveo U280 和 U50 电路板。如果您有兴趣了解更多关于赛灵思 CCIX 产品的信息,请联系您的赛灵思销售代表。
CCIX 联盟成员由各大行业技术龙头企业代表组成,旨在协同制定统一的互联技术规范,以确保采用不同指令集架构 (ISA) 的处理器能与加速器一致共享数据,并实现高效的异构计算,从而大幅提高运行数据中心工作负载和嵌入式应用 (如 5G 无线和移动边缘计算) 的服务器的计算效率。
-
PCIe
+关注
关注
15文章
1213浏览量
82382 -
机器学习
+关注
关注
66文章
8359浏览量
132337 -
大数据
+关注
关注
64文章
8856浏览量
137232
发布评论请先 登录
相关推荐
评论