0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

FPGA上的二维片上网络支持高带宽数据加速应用

FPGA之家 来源:Achronix 2023-02-20 14:46 次阅读

1. 概述

在摩尔定律的推动下,集成电路工艺取得了高速发展,单位面积上的晶体管数量不断增加。片上系统(System-on-Chip,SoC)具有集成度高、功耗低、成本低等优势,已经成为大规模集成电路系统设计的主流方向,解决了通信、图像、计算、消费电子等领域的众多挑战性的难题。随着片上系统SoC的应用需求越来越丰富,SoC需要集成越来越多的不同应用的IP(Intellectual Property)。另外,片上多核系统MPSoC(MultiProcessor-System-on-Chip)也已经成为必然的发展趋势。

随着SoC的高度集成以及MPSoC的高速发展,对片上通信提出了更高的要求。片上网络技术(Network-on-Chip,NoC)在这个时候也得到了极大的应用,它本质上就是提供一种解决芯片内不同IP或者不同核心之间数据传输的片上通信方案。

片上网络技术从发明至今已有20多年的历史,在SoC中已经有了广泛的应用。针对片上网络高带宽、低延迟的特性,主流FPGA公司也开始考虑将NoC用于高端FPGA中来解决数据传输的高带宽需求。Achronix的新一代7nm工艺的Speedster 7t便是最早集成了NoC的高端FPGA之一。

2. 片上互连架构的发展

片上互联架构的发展主要经历了三个阶段:共享总线(Bus)、Crossbar以及片上网络(NoC)[1]。

(1) 传统的SoC片上通信结构一般采用共享总线的方式。在共享总线结构中,所有的处理器和IP模块共享一条或多条总线。当有多个处理器同时访问一条总线时候需要有仲裁机制来决定总线的所有权。共享总线片上通信系统结构一般比较简单,且硬件代价也小。但是带宽有限,而且带宽也没法随着IP的增多而进行扩展。1996年,ARM公司提出的AMBA总线广泛应用于嵌入式微处理器的片上总线,现在已经成为事实上的工业标准。

d4498054-af28-11ed-bfe3-dac502259ad0.png

图2 典型的AMBA总线系统[2]

(2) 对于传统的共享总线,当多个处理器同时去访问不同的IP的时候,因为需要仲裁机制去决定总线的所有权,所以传统的总线方式在这种情况下就会造成一定的瓶颈,最大的问题就是访问的延时。在这种情况下,为了满足多处理同时访问的需求同时提高整个系统的带宽,一种新的解决方案Crossbar孕育而生,如图3所示一个典型的Crossbar结构。

Crossbar保证了多路通信同时进行的实时性,只要不是访问同一个目标设备,就不需要用到仲裁,大大减少了因为仲裁带来的瓶颈问题。但是随着设备数的增加,Crossbar的规模会以几何级数增长。所以通常我们通过桥接设备去级联多个Crossbar来支持设备的扩展。但是桥接设备可能会成为系统的瓶颈,增加传输的延迟。

d472b028-af28-11ed-bfe3-dac502259ad0.png

图3 典型的单向8x8 Crossbar

实际应用中,我们通常也会采用Crossbar和共享总线相结合的方式,用桥接器将Crossbar网络和共享总线网络连接起来,如图4所示一个典型的混合型拓扑结构。

d49b7b98-af28-11ed-bfe3-dac502259ad0.png

图4 典型的混合拓扑网络

(3) 片上网络NoC带来了一种全新的片上通信方法,显著优于传统的总线式和Crossbar的性能。NoC是一种可扩展性更好的设计。在NoC架构中,每一个模块都连接到片上路由器,模块传输的数据则是形成了一个个数据包,通过路由器去送达数据包的目标模块。如图5所示是一个典型的NoC结构,图中的R表示Router, 所有的Router可以是同步,但每个Router所连接的PE(Processing Element)与Router异步,自成一个时钟域(Clock Domain)。所以基于NoC的系统能更好地适应在复杂多核SoC设计中使用的全局异步局部同步时钟机制。另外,NoC可以支持各种扩展功能,比如流量控制(flow control)、服务质量(QoS)等等。因此,NoC是多核系统的最佳互联机制。

d4c1b696-af28-11ed-bfe3-dac502259ad0.png

图5 典型的片上网络NoC结构

3. NoC在高端FPGA的应用

FPGA在日益增长的数据加速需求上正在发挥越来越重要的作用。为了满足云计算和边缘计算中各种高性能应用的需求,FPGA作为一种可编程可定制化的高性能的器件逐步成为一条部署高吞吐量数据加速的快捷途径。但同时这些高性能的加速应用也对高端FPGA提出了更高的要求,高算力、高带宽的数据传输以及高带宽的存储器。

片上网络技术已经比较广泛的用于SoC中,并取得了比较好的效果。近年来才慢慢用于FPGA中,Achronix创建了一种可最大限度地提高系统吞吐量的Speedster 7t FPGA芯片,创新地将二维片上网络(2D NoC)运用到了FPGA中,可以在逻辑阵列内的处理单元与各种片上高速接口和存储器接口之间高速地传输数据,真正实现了数据密集型应用吞吐量的最大化。有了片上网络的FPGA如虎添翼,带来了传统FPGA所不及的很多优势,势必在各种数据加速应用中发挥巨大的作用。

4. NoC给Speedster 7t FPGA带来的优势

Achronix Speedster 7t FPGA拥有支持单通道速率112Gbps的SerDes、400G以太网MAC、PCIe GEN5控制器以及带宽高达4Tbps带宽的GDDR6控制器,为各种数据加速应用提供了高带宽的I/O接口和高带宽的存储器。在这类应用中,会有大量的数据进入FPGA进行处理,处理后的数据会通过FPGA输出,所以除了FPGA算力以外,数据移动速度直接决定了器件的性能以及用户的体验。为了提高数据传输速率,Achronix在Speedster 7t FPGA中专门设计了不同于传统FPGA数据移动通道的片上网络。如图6所示。这是一个可横跨和垂直跨越FPGA逻辑阵列的创新性的、高带宽的二维片上网络(2D NoC),它不仅可以连接到所有FPGA高速接口、高带宽存储器接口,还可以作为内部逻辑之间的互连。

d4ee742e-af28-11ed-bfe3-dac502259ad0.png

图6 Speedster 7t片上网络(NoC)结构

Speedster 7t FPGA上的二维片上网络(2D NoC)不是由可编程逻辑搭建,而是固化的ASIC逻辑实现,固定运行频率为2GHz,每一行或者每一列的NoC都可以作为两个单向256位实现双向的通路,所以每个方向可提供512Gbps的带宽,整个网络总带宽则能达到27Tbps。

下面的表格列出了Speedster 7t FPGA中NoC的特性。

d53e2f78-af28-11ed-bfe3-dac502259ad0.png

NoC为FPGA提供了以下几项重要优势:

(1) 大幅提高设计性能,解决一些高性能应用如400G以太网的性能瓶颈:通常在数据流经过400G以太网MAC解包以后会是一个超高位宽且需要运行在很高频率的处理,这在传统FPGA逻辑单元里面是无法实现的,而NoC就能解决性能瓶颈。我们会在后续文章具体说明。

(2) NoC是在传统可编程逻辑之外额外增加的走线资源,所以在高资源占用设计中可以降低布局布线拥塞的风险。

(3) NoC包含了异步时钟转换,仲裁控制等逻辑,可以去替代传统的逻辑去做高速接口和总线管理等,所以利用NoC可以简化用户设计节省一部分传统资源(LE、FIFO和布线等)的使用。

(4) NoC部分是ASIC固化逻辑,功耗比传统的FPGA可编程逻辑实现要低很多。

(5) 利用NoC可以实现真正的模块化设计。传统高端FPGA设计通常是需要一个FPGA工程师团队来完成,每个工程师设计自己模块,在FPGA整个芯片里调试验证自己模块,然后再把各个模块连接成更大的完整设计,这时候会由于资源占用上升,通常需要花很多时间去优化布局甚至去修改设计以达到目标性能。而在Achronix Speedster7t 中可以让模块之间通过NOC互联,再借助对于单个模块功能性能调试完成后固定布局技术,甚至可以达到NoC互联后整体设计不需要额外联调的可能。这样可以大幅减少研发工作量和时间。






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1629

    文章

    21754

    浏览量

    604201
  • 集成电路
    +关注

    关注

    5389

    文章

    11572

    浏览量

    362223
  • 片上系统
    +关注

    关注

    0

    文章

    186

    浏览量

    26835
  • NoC
    NoC
    +关注

    关注

    0

    文章

    38

    浏览量

    11738

原文标题:片上网络(NoC)技术的发展及其给高端FPGA带来的优势

文章出处:【微信号:zhuyandz,微信公众号:FPGA之家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于FPGA的多时钟上网络设计

    FPGA 设计一个高性能、灵活的、面积小的通信体系结构是一项巨大的挑战。大多数基于FPGA上网络都是运行在一个单一时钟下。随着
    发表于 10-21 16:13 1422次阅读
    基于<b class='flag-5'>FPGA</b>的多时钟<b class='flag-5'>片</b><b class='flag-5'>上网络</b>设计

    利用上高速网络(2D NoC)创新地实现FPGA内部超高带宽逻辑互连

    Achronix 最新基于台积电(TSMC)的7nm FinFET工艺的Speedster7t FPGA器件包含了革命性的新型二维上网络(2D NoC)。
    发表于 02-27 17:08 1957次阅读

    Achronix在其先进FPGA中集成2D NoC以支持带宽设计(WP028)

    创新的二维上网络(2D NoC)来处理这些带宽数据流。Achronix的
    的头像 发表于 04-21 18:02 6117次阅读
    Achronix在其先进<b class='flag-5'>FPGA</b>中集成2D NoC以<b class='flag-5'>支持</b><b class='flag-5'>高</b><b class='flag-5'>带宽</b>设计(WP028)

    基于FPGA的多时钟上网络该怎么设计?

    FPGA 设计一个高性能、灵活的、面积小的通信体系结构是一项巨大的挑战。大多数基于FPGA上网络都是运行在一个单一时钟下。随着
    发表于 08-21 06:47

    二维码软件中制作Dot Code二维码的步骤

      在二维码软件中,点击软件左侧的“二维码”按钮,在画布绘制二维码样式,双击二维码,在图形属性-条码选项卡中,设置条码类型为Dot Cod
    发表于 12-02 15:45

    图像的二维提升小波变换的FPGA实现

    本文将实现基于FPGA的图像二维5/3提升小波变换,采用FPGA芯片实现计算量十分复杂的二维提升小波变换,可以大大提高图像压缩运算速度,保证系统的实时性要求。
    发表于 06-29 11:59 3546次阅读
    图像的<b class='flag-5'>二维</b>提升小波变换的<b class='flag-5'>FPGA</b>实现

    一种基于FPGA二维DCT和IDCT的新算法

    提出了一种新的二维DCT和IDCT的FPGA实现结构,采用行列快速算法将二维算法分解为两个一算法实现,其中每个一算法采用并行的流水线结构
    发表于 01-12 10:35 59次下载
    一种基于<b class='flag-5'>FPGA</b>的<b class='flag-5'>二维</b>DCT和IDCT的新算法

    二维码的四种主要应用模式

    本文介绍二维码主要的四种应用模式,包括读取数据模式、解码上网模式、解码验证模式、解码通信模式。
    发表于 01-25 11:52 3441次阅读

    C语言程序设计教程之二维数组如何应用二维数组的资料概述

    本文档的主要内容详细介绍的是C语言程序设计教程之二维数组如何应用二维数组的资料概述主要内容包括了:1 了解二维数组2 二维数组的简单应用3 利用地址和指针访问
    发表于 10-26 16:48 3次下载

    2D NoC可实现FPGA内部超高带宽的逻辑互连

    Achronix 最新基于台积电(TSMC)的7nm FinFET工艺的Speedster7t FPGA器件包含了革命性的新型二维上网络(2D NoC)。
    发表于 05-04 09:43 722次阅读

    通过2D NoC可实现FPGA内部超高带宽逻辑互连

    Achronix 最新基于台积电(TSMC)的7nm FinFET工艺的Speedster7t FPGA器件包含了革命性的新型二维上网络(2D NoC)。
    发表于 05-28 10:27 646次阅读
    通过2D NoC可实现<b class='flag-5'>FPGA</b>内部超高<b class='flag-5'>带宽</b>逻辑互连

    上网络超立方裂变拓扑结构

    上网络是解决上网络通讯瓶颈的重要途径,拓扑结构是三
    发表于 05-11 17:00 9次下载

    混合无线上网络架构及路由算法

    混合无线上网络架构及路由算法
    发表于 06-03 14:28 7次下载

    浅析可视化的上网络(NoC)性能

    1. 概述 Achronix 最新基于台积电(TSMC)的7nm FinFET工艺的Speedster7t FPGA器件包含了革命性的新型二维上网络(2D NoC)。2D NoC如同
    的头像 发表于 11-12 09:21 2236次阅读
    浅析可视化的<b class='flag-5'>片</b><b class='flag-5'>上网络</b>(NoC)性能

    上海光机所在光学操控二维纳米运动方面获得进展

    研究团队利用传统的机械剥离法在蓝宝石衬底制备了二维金属纳米,利用光学显微镜将飞秒脉冲激光垂直辐射在纳米:当脉冲激光照射时,
    的头像 发表于 04-28 10:35 804次阅读
    上海光机所在光学操控<b class='flag-5'>二维</b>纳米<b class='flag-5'>片</b>运动方面获得进展