0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

时钟树综合CTS阶段如何去降低Latency和Skew

sanyue7758 来源:处芯积律 2023-05-22 09:38 次阅读

对于时钟树综合,各位后端工程师应该都很熟悉,做好一个模块/一个chip的时钟树,对整个项目的功耗和Timing影响都是巨大的。一个优秀的后端工程师,也不会只是单纯的放置几个TAP点,来工具根据source group来自己分点做Tree,这样只会跑flow 做树的工程师在面对工具搞不定的复杂时钟结构的时候,只能束手无策,导致绕线完返修,花费很多时间在signoff阶段,对时序和功耗硬修,甚至导致流片delay,今天我们就来根据项目经验来帮助大家做出更好,更完美的时钟树!

cb1ced08-f812-11ed-90ce-dac502259ad0.png

图一 一个最常见的muti Clock的时钟树结构

首先我们要明白做树的最终目的—当然是为了PPA的提升,其实不做树可不可以?当然可以!当你当前的模块规模比较小,且没啥时序风险和PV,PI风险的时候,甚至可以不做树。但是时钟结构复杂/时序功耗本身就有风险的模块就不行了,树做的不好将会导致ecoRoute完signoff阶段的时序收不下来,功耗很差,甚至根本没法收敛,导致最后回退版本,老老实实回去做树!那小编觉得就完全没有必要了,我们以innovus为例,来帮助大家快速做到对树的收敛,从而对CTS有更深的理解,而非只会跑flow看结果。

其实对于CTS这个步骤,我们可以把从初始时钟结构到最终的时钟树结构分为三个阶段,并且在这三个阶段分别去存对应的Database,以方便分析究竟是哪一步出问题了?

第一部分—分点,这一部分主要靠工具去完成,工具会识别后端工程师提供的source group(这个根据工程师设置的tap点来定组),并将同一skew group下source group下面的对应tap点(可以是MUX,BUFF,INV,ICG等等)的OutPutPin的generate clk视为一样的时钟结构,进而工具会clone主Gating下除Sink点以外的原本时钟路径上的逻辑单元和时序单元,并将整条Path包含Sink点挂到离其最近,时序更优的Tap点下,这一分点形成初始树的过程,在Innovus下通过以下命令实现:

cb3b7bd8-f812-11ed-90ce-dac502259ad0.png

对于复杂的时钟结构,即多个分频时钟,倍频CRG子时钟,工具没办法很好的去分点或者说没有过多的考虑时序,而是单纯考虑距离,对Sink点进行暴力切分,导致Common Path的长度非常的短,共同路径由source port到clone gating变成只有source port到主 ICG,这有可能会使得不同分点下的两个Sink的local skew偏大,进而影响postCTS后的timing。这种情况我们可以通过分点完后自己手动ec挂点/分点前在Spec约束文件添加preserve port来控制工具的分点结果。

第二部分—Cluster解DRV,这一部分也主要靠工具去完成,在开始这步骤之前,工程师需要检测对于部分Net有么有设置dont touch,有没有设置ideal net,以免CTS综合后发现部分CK Cell的transition过大,一追溯发现是DRV没有解决,这一部分引起latency增大的原因其实主要是因为Placement摆放CK cell位置的不合理,使得时钟路径发生了detour,增加了Net delay和部分本可以不存在的解transiton的INV。这一部分遇到问题的主要解决办法为:1.检查place阶段是不是有些Sink的局部density过大/过小,导致工具在修DRV的时候拉扯较远/没有位置摆放INV;2.手动ec,将最后一级INV的Fanout Sink直接挂到最近一级Clone的gating上,再解DRV(记得带个强驱动的BUFF一起挂,否则可能会因为clone gating的outputload突然增大而导致transition解的不好,传递到下几级,导致latency增大)

第三部分—Full阶段长树,这一部分工具会根据你的Spec约束来对Sink之间的Skew进行平衡,在innovus中我们一般通过ccopt_design来进行长tree和OPT同步的操作,实际上innovus在ccopt阶段初期,首先会确定placement的信息,其中包括density和DRC的相关信息的check,然后在准备阶段,innovus会刷新一遍IO的skew,并判断各个skewgroup之间的关系,哪个是主clk,哪个是generateclk,是否存在复制关系?在判断完skewgroup的复制关系后,innovus会进行early global route,进行快速绕线,以判断有没有绕线风险,并且检查检查NDR以及track的完整性等等。

所以基于以上工具的三个阶段操作,后端APR工程师们需要明确分点做树的阶段目标是什么?1.降低latency,以与其他模块的时钟树串起来对齐;2.降低local skew,以减少后期fix timing工作量,降低timing风险;3.增加common path的delay,目的也是为了降低latency和local skew;4.减少CK cell的数量,有利于降低面积和功耗。在这里,小编基于日常项目给出几种做短树的latency和做小skew的方法:

增加TAP点的数量,这个方法虽然可以有效的降低skew和latency,但是会带来功耗负担以及面积浪费,并且随着TAP点增加到一定数量,收益其实会逐渐收敛。所以这个方法后端工程师最好建立在规定数量TAP点实在修不下来delay和skew的时候再使用。

修改target来优化工具的分点和balance长树,内容主要包括(注: 修改要在clk spec生产后,即generate spec后分点前)

cbf2f1a0-f812-11ed-90ce-dac502259ad0.png

增加new skrewgroup以及generated clk来指导工具解drv和长tree(这个主要优化latency,skew变化并不大),以图一的CLK结构为例子,Fast Clk下MUX的ZN端可以设置generate CLK,并以这个为source,设置一个新的skew group.

cc142244-f812-11ed-90ce-dac502259ad0.png

Size up时钟路径上的icg以及buffer/inv,logic等instance,这样可以增加驱动,降低transition,进而降低latency(这种方式不仅会优化latency,skew也会由一定的优化),比如D4的DCCKBUF换成D8的BUFF,H12的BUFF换成H9的BUFF等等。

可以通过提树/推树的xxx ps的方法,来做长做短树,Place阶段推树/cts阶段设置insertation delay都有利于树的做短(这个方法主要影响的是balance长tree阶段),这个通常可以针对cluster阶段latency不大,但是balance长tree阶段突然树长变长的path,例如

cc355b80-f812-11ed-90ce-dac502259ad0.png

修改Space中的CK Pin的类型,有些不影响Timing的前提下把Pin设置成为stop ignore throughpin(这个方法主要影响的是balance长tree阶段)

一些ec操作,一般是工具分点/解DRV有问题的时候,才需要工程师去手动,比如重新挂点,presever pin,手动clone icg挂点等等

掌握了以上这些内容,想必各位ICer将会对CTS有更深的理解,CTS的实现其实随着模块时钟复杂的变化会有更多其他方法去降低Latency以及Skew,例如调整flowPlan,与前端商量修改RTL代码的时钟结构,修改综合时候map的lib cell,引入Mesh Cell等等。但是所有的一切,都是为了芯片有个更好的PPA,这样才能让你和大家的加班没有白费!





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DRV
    DRV
    +关注

    关注

    0

    文章

    18

    浏览量

    20638
  • 时钟树
    +关注

    关注

    0

    文章

    53

    浏览量

    10732
  • Mux
    Mux
    +关注

    关注

    0

    文章

    38

    浏览量

    23350
  • CTS
    CTS
    +关注

    关注

    0

    文章

    34

    浏览量

    14054

原文标题:细聊时钟树综合CTS阶段如何去降低Latency和Skew

文章出处:【微信号:处芯积律,微信公众号:处芯积律】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    时钟优化与有用时钟延迟

    时钟优化与有用时钟延迟在 “后端时序修正基本思路” 提到了时序优化的基本步骤。其中,最关键的阶段就是时钟
    发表于 10-26 09:29 4391次阅读
    <b class='flag-5'>时钟</b><b class='flag-5'>树</b>优化与有用<b class='flag-5'>时钟</b>延迟

    射频识别芯片设计中时钟功耗的优化与实现

    TypeC协议的UHF RFID标签基带处理器的的优化和实现。##降低功耗主要方法##RTL阶段手工加时钟门控##综合阶段工具插于集成门控
    发表于 03-24 14:36 4283次阅读

    数字IC设计中的分段时钟综合

    为什么需要分段去做时钟呢?因为在某些情况下,按照传统的方法让每一个clock group单独balance,如果不做额外干预,时钟天然
    的头像 发表于 12-04 14:42 1837次阅读
    数字IC设计中的分段<b class='flag-5'>时钟</b><b class='flag-5'>树</b><b class='flag-5'>综合</b>

    哪些因此会导致时钟skew过大呢?FPGA中降低时钟skew的几种方法

    在时序报告中,会显示出clock path skew,如果时钟偏移超过0.5ns,就需要额外关注了。
    的头像 发表于 03-13 09:06 1340次阅读
    哪些因此会导致<b class='flag-5'>时钟</b><b class='flag-5'>skew</b>过大呢?FPGA中<b class='flag-5'>降低</b><b class='flag-5'>时钟</b><b class='flag-5'>skew</b>的几种方法

    CTS的前世今生

    时钟,也是衡量时钟性能的重要指标。并不是单一地认为这些参数越小越好,有利必有弊,整个PR流程中没有绝对的概念,而如何综合考虑这些参数,
    发表于 01-18 17:35

    如何使用基于STM32的时钟和通用定时器呢

    如何使用基于STM32的时钟和通用定时器呢?怎样分析基于STM32的通用定时器复用功能重映射呢?
    发表于 11-09 06:42

    如何做好ARM Cortex-A7时钟

    根据之前的介绍,我们已经掌握了ICC2和Innovus中如何根据工具提供的Clock Tree Analysis Window来分析时钟的结构(Innovus对应的是Clock Tree
    发表于 05-31 11:55

    ccopt主要有几个步骤?每个步骤都做了什么事

    这里前面的检查阶段就完成了。1.4 optDesignGlobalRouteStep执行时钟综合进程:先对时钟
    发表于 08-19 16:27

    !大量收购/回收CTS60综合测试仪CTS60 孙峰/何S:13549469921

    !大量收购/回收CTS60综合测试仪CTS60 孙峰/何S:13549469921 东莞市宏达电子仪器有限公司 联系人:孙峰/何S(销售工程师):13549469921 客 服QQ
    的头像 发表于 03-27 05:11 1274次阅读

    multi-tap的FlexHtree自动化时钟综合流程

    时钟综合CTS)相结合来控制整个时钟的clock s
    的头像 发表于 08-15 10:01 1w次阅读
    multi-tap的FlexHtree自动化<b class='flag-5'>时钟</b><b class='flag-5'>树</b><b class='flag-5'>综合</b>流程

    如何能让自己的芯片变得更有竞争力

    时钟latency如果比较长,则需要想到定制大尺寸时钟单元。这样可以减小时钟树上的latency
    的头像 发表于 04-25 17:06 2417次阅读

    评价时钟质量的方法

    时钟综合,通常我们也叫做CTS时钟综合就是建立
    的头像 发表于 09-05 10:11 1866次阅读

    详解数字设计中的时钟与约束

    : ·同步电路与异步电路; ·时钟/时钟的属性:偏移(skew)与时钟的抖动(jitter)、延时(l
    的头像 发表于 01-28 07:53 2859次阅读
    详解数字设计中的<b class='flag-5'>时钟</b>与约束

    CTS时钟综合对uncertainty的影响

    时钟电路的设计中,存在 jitter 和 skew 问题。
    的头像 发表于 06-26 16:49 2018次阅读
    <b class='flag-5'>CTS</b><b class='flag-5'>时钟</b><b class='flag-5'>树</b><b class='flag-5'>综合</b>对uncertainty的影响

    时钟是什么?介绍两种时钟树结构

    今天来聊一聊时钟。首先我先讲一下我所理解的时钟是什么,然后介绍两种时钟树结构。
    的头像 发表于 12-06 15:23 1596次阅读