0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

片上网络初探:基础概念与入门指南

ruikundianzi 来源:知乎 2024-03-07 11:40 次阅读

前言

在过去的几十年里,集成电路制造工艺技术、封装与测试技术、设计方法学和EDA 工具等微电子相关技术始终保持着快速的发展。根据国际半导体技术发展路线图(International Technology Roadmap for Semiconductors, ITRS)预测,到2024年IC 制造技术将达到8.9 nm,每平方毫米集成的晶体管数目将达到90 亿个。但是,全局互连线的性能提升程度明显低于晶体管性能提升程度。受到亚阈值漏电流功耗、动态功耗、器件可靠性以及全局互连线等影响,通过提升单个处理器核的性能来提升系统整体性能已变得非常难以实现,同时芯片设计的难度和复杂度也在进一步增加。片上系统(System on Chip, SoC)具有集成度高、功耗低、成本低、体积小等优点,已经成为超大规模集成电路系统设计的主流方向。

随着片上系统SoC 的应用需求越来越丰富、越来越复杂,片上多核MPSoC (MultiprocessorSystem on Chip, MPSoC) 已经成为发展的必然趋势,同时MPSoC 上集成的IP 核数量也将会按照摩尔定律继续发展。目前,MPSoC 已经逐渐应用于网络通信、多媒体等嵌入式电子设备中。半导体工艺技术的快速发展为集成电路设计提供了很大的发展空间,同时也带来了一系列新的问题和挑战,如芯片的性能、功耗、可靠性、可扩展性等等。

随着系统性能需求越来越高,处理器核之间的互连架构必须能够提供具有较低延迟和高吞吐率的服务,并且具有良好的可扩展性。传统的基于总线的集中式互连架构已经难以满足现今系统的性能需求,而基于报文交换的片上网络(Network on Chip, NoC)逐渐成为片上多核间通讯的首选互连架构。在NoC 中,路由节点之间通过局部互连线相连接,每一个路由节点通过网络接口NI 与一个本地IP 核相连接,源路由节点和目的路由节点之间的数据通讯需要经过多个跳步来实现。因此,NoC 技术的出现使得片上系统SoC 的设计也将从以计算为中心逐渐过渡到以通讯为中心。

传统的SoC 系统采用总线互连结构,如图1.1 所示。虽然人们已经提出了很多改进的总线结构,例如将共享总线改进为桥接多总线结构、层次化总线结构等更复杂的结构。但是当进入MPSoC 时代,单芯片上集成的处理器核数越来越多时,总线结构在通讯性能、功耗、全局时钟同步、信号完整性以及信号可靠性等方面面临着巨大的挑战,这些复杂的改进型总线结构仍无法解决片上多核间通信所面临的问题。因此,MPSoC 上多核间的通讯问题已经成为制约系统性能提升的主要瓶颈。

NoC 的概念是由Agarwal(1999 年)、Guerrier 和Greiner(2000 年)、Dally 和Towles(2001 年)、Benini 和Micheli(2002 年)、Jantsch 和Tenhunen(2003 年)等人逐步提出的。目前,NoC 的研究仍处于初级阶段,但随着半导体工艺技术的进步和芯片集成度的提高,NoC 的设计已成为现实,并展现出非常广阔的前景[2]。目前,对于NoC 还没有一个统一的定义,大多数NoC 研究者认为NoC 是SoC 系统的通讯子集,并且应该引入互联网络技术来解决片上多核的通讯问题。

随着单芯片上集成的处理器核数越来越多,片上互连架构经历了从专用互连线,Bus,Crossbar到NoC。NoC 借鉴了分布式计算系统的通讯方式,采用数据路由和分组交换技术替代传统的总线结构,从体系结构上解决了SoC 总线结构由于地址空间有限导致的可扩展性差,分时通讯引起的通讯效率低下,以及全局时钟同步引起的功耗和面积等问题。与传统的总线互连技术相比,片上网络具有如下优点:

第一,网络带宽。总线结构互连多个IP 核,共享一条数据总线,其缺点是同一时间只能有一对IP 进行通信。随着系统规模的逐渐增大,总线结构的通信效率必然成为限制系统性能提升的瓶颈。片上网络具有非常丰富的信道资源,为系统提供了一个网络化的通信平台。网络中的多个节点可以同时利用网络中的不同物理链路进行信息交换,支持多个IP 核并发地进行数据通信。随着网络规模的增大,网络上的信道资源也相应增多。因此,NoC 技术相对于Bus 互连技术具有较高的带宽,以及更高的通信效率。当并发进行数据通信时网络会产生竞争,即会存在请求同一条物理链路的节点对。NoC 的路由节点通过分时复用物理链路来解决竞争,与Bus 结构相比,NoC 能够降低竞争发生的概率。

第二,可扩展性和设计成本。总线结构需要针对不同的系统需求单独进行设计,当系统功能扩展时,需要对现有的设计方案重新设计,从而严重影响设计的周期和资本投入。NoC 中每个路由节点和本地IP 核通过网络接口(NetworkInterface, NI)相连,当系统需要升级扩展新功能时,只需要将新增加的处理器核通过网络接口NI 接入到网络中的路由节点即可,无需重新设计网络。因此,片上网络具有良好的可扩展性。片上网络作为一个独立的片上互连结构,能够满足不同系统的应用需求,当网络中节点数量增加时,仅需要按照相应的拓扑结构规则继续增大网络的规模即可,缩短了产品的设计周期,节约了设计成本。

第三,功耗。随着SoC 规模的不断增大,总线上每次信息交互都需要驱动全局互连线,因此总线结构所消耗的功耗将显著增加,并且随着集成电路工艺的不断发展,想要保证全局时钟同步也将变得难以实现。而在NoC 中,信息交互消耗的功耗与进行通讯的路由节点之间的距离密切相关,距离较近的两个节点进行通讯时消耗的功耗就比较低。

第四,信号完整性和信号延迟。随着集成电路特征尺寸的不断减小,电路规模的不断增大,互连线的宽度和间距也在不断地减小,线间耦合电容相应增大,长的全局并行总线会引起较大的串扰噪声,从而影响信号的完整性以及信号传输的正确性。同时,互连线上的延迟将成为影响信号延迟的主要因素,总线结构全局互连线上的延迟将大于一个时钟周期,从而使得时钟的偏移很难管理。

第五,全局同步。总线结构采用全局同步时钟,随着芯片集成度的提高,芯片的工作频率也在不断提高,在芯片内会形成很庞大的时钟树,因此很难实现片上各个模块的全局同步时钟。采用时钟树(Clock Tree)优化的方法可以改善由时钟翻转引起的时钟偏差和时钟抖动,但同步时钟网络所产生的动态功耗甚至可达总功耗的40%以上。为了提高系统的时钟频率,只能对全局互连线采用分布式流水线结构,或者采用全局异步局部同步(Global Asynchronous Local Synchronous,GALS)的时钟策略。

NOC发展史

之前的芯片设计比较简单,往往只需要总线就可以实现基本功能,但是随着芯片复杂度的提升,对总线的竞争变得越来越显著,会使得总线很快饱和,为了解决这总问题,仲裁器,分离事务传输等方法引入了片上总线系统,例如axi协议,metrix等。

但时这样虽然解决了总线竞争和带宽的问题,却也带了了很大的面积提升以及功耗的增加。由于上面的种种原因,NOC成为总线和交叉开关最有吸引力的替代方案。可拓展性大大提高,想必大家都遇到过AXI metrix拓展的痛苦过程,NOC的拓展就简单的多,只需要增加一个NIU接口就可以了,并且随着节点的增加,带宽增幅也是近似于线性的。并且NOC具有很多相邻短路径和链路复用,这对后端的布线也是很有帮助的。

NOC的基本建模

拓扑:由传输通道和路由器router组成。

路由:路由决定source到target的路径,合理的算法可以影响NOC的吞吐量和性能。

流控:流控就是给消息提供buffer和带宽。

路由器微体系结构:由输入缓冲区,路由器状态,路由逻辑,分配器和交叉开关组成。路由器通常设计为流水线结构,以提高吞吐量,毕竟NOC的主要延迟就在这一块。

链路结构:使用传统的全摆幅逻辑和中继器。

性能和成本

性能指的是网络传输的延迟和能接受的流量。零负载延迟的算法就是跳数x路径距离,这是延迟的下限值。

除了降低延迟,还需要提高吞吐量。随着吞吐量的提升,带来的延迟呈现指数增长的趋势。

成本开销主要就是面积和功耗,后面再具体分析。

审核编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19159

    浏览量

    229115
  • 路由器
    +关注

    关注

    22

    文章

    3706

    浏览量

    113536
  • 总线
    +关注

    关注

    10

    文章

    2866

    浏览量

    87984
  • 片上网络
    +关注

    关注

    0

    文章

    33

    浏览量

    11795
  • NoC
    NoC
    +关注

    关注

    0

    文章

    38

    浏览量

    11720

原文标题:片上网络入门

文章出处:【微信号:IP与SoC设计,微信公众号:IP与SoC设计】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于遗传算法的上网络虚通道分配算法

    【作者】:李晓辉;曹阳;王力纬;陈晨;【来源】:《华中科技大学学报(自然科学版)》2010年03期【摘要】:针对虚通道技术导致上网络(NoC)面积增加的问题,提出了一种基于遗传算法的NoC虚通道
    发表于 04-22 11:34

    关于上网络优化问题

    求关于上网络各个ip核之间的热阻和功耗对io核温度的影响,最好具体到公式表达
    发表于 04-30 00:16

    基于FPGA的多时钟上网络该怎么设计?

    在FPGA 上设计一个高性能、灵活的、面积小的通信体系结构是一项巨大的挑战。大多数基于FPGA 的上网络都是运行在一个单一时钟下。随着FPGA 技术的发展,Xilinx 公司推出了Virtex-4
    发表于 08-21 06:47

    上网络有什么优缺点?

    上网络的研究才刚刚起步,还没有在商业产品中广泛应用。上网络的标准化可以增加组件的互连性,但会造成性能的损失,而对特定的上系统,性能是
    发表于 09-19 09:10

    一种用于上网络的交换开关结构

    半导体技术的飞速发展推动了上系统设计进入到上网络阶段。为了进一步研究其结构及不同工艺对其的影响,文章分析了上网络对于
    发表于 08-21 09:03 12次下载

    上网络通信性能分析建模与缓存分配优化算法

    该文建立了一种面向应用设计的上网络的性能分析模型,并在此基础上提出了上缓存优化策略和分配算法。在硬件实现平台上的仿真表明,该文建立的上网络
    发表于 11-18 15:20 9次下载

    上网络的功耗研究

    随着芯片上晶体管数量发展到10亿数量级,功耗逐渐成为芯片设计的首要制约因素。本文分别从CMOS电路和网络通讯两个层面上来分析上网络(NoC)的功耗,并给出了相应的功耗
    发表于 12-14 09:51 6次下载

    上网络系统网络层设计与研究

    本文参照传统的OSI(Open Systems Interconnection)模型与TCP/IP 模型对上网络系统模型层次结构进行了按照片上网络特点进行的划分。文中还对
    发表于 12-14 09:54 8次下载

    一种用于上网络的交换开关结构

    半导体技术的飞速发展推动了上系统设计进入到上网络阶段。为了进一步研究其结构及不同工艺对其的影响,文章分析了上网络对于
    发表于 07-17 16:53 19次下载

    一种上网络自适应路由算法仿真与验证

    针对上网络的死锁问题,提出一种上网络自适应路由算法——虚拟网络(VN)路由算法,该算法根据报文源地址和目的地址将
    发表于 07-21 16:09 13次下载

    分级环上网络互连

    本内容介绍了分级环上网络互连
    发表于 05-19 15:37 21次下载
    分级环<b class='flag-5'>片</b><b class='flag-5'>上网络</b>互连

    Sonics推出业内首款GHz级上网络

    世界头号上通信IP供应商Sonics公司(R)今天面向高级并发应用处理和系统级设计推出了业内首款GHz级上网络(NOC)SonicsGN(TM)(SGN)。
    发表于 09-22 18:09 1665次阅读

    一种低延时上网络路由器的设计与实现

    通过分析流水线结构和单周期结构的上网络路由器,提出了一种低延时上网络路由器的设计,并在SMIC 0.13um Mixed-signal/RF 1.2V/3.3V工艺进行流
    发表于 06-25 16:25 40次下载
    一种低延时<b class='flag-5'>片</b><b class='flag-5'>上网络</b>路由器的设计与实现

    上网络的SystemC建模研究

    为了实现软硬件协同设计和提高仿真速度的需求,采用SystemC语言的建模方法,通过对上网络体系结构的研究,提出了一种上网络的建模方案,并对一个mesh结构完成了SystemC的建模
    发表于 07-30 11:46 42次下载
    <b class='flag-5'>片</b><b class='flag-5'>上网络</b>的SystemC建模研究

    上网络概述与FPGA研究(连载1)

    上网络Network-on-chip (NoC) 是一种应用于大规模集成电路(VLSI)系统中的,一种新的上系统(System-on-chip)的设计方法。
    发表于 02-11 06:39 1734次阅读
    <b class='flag-5'>片</b><b class='flag-5'>上网络</b>概述与FPGA研究(连载1)