0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么数字芯片设计适合暴力堆机器?

sally100 来源:数字ICer 2023-02-07 11:44 次阅读

芯片设计五部曲》:模拟IC、数字IC、存储芯片、算法仿真和总结篇(排名不分先后

上一集我们已经说了,模拟IC,更像是一种魔法。

我们深度解释了这种魔法的本质,以及如何在模拟芯片设计的不同阶段,根据常见的EDA工具特性和原理,从计算角度帮助模拟工程师更高效地完成吟唱施法。

芯片设计五部曲之一 | 声光魔法师——模拟IC

第二集:数字IC

假如我们想要录制一段声音,模拟信号的做法是把所有的声音信息用一段连续变化的电磁波或电压信号原原本本地记录下来。而按照一定的规则将其转换为一串二进制数0和1,然后用两种状态的信号来表示它们,这叫数字信号

处理数字信号的芯片就是数字芯片,比如常见的CPUGPU

6f0c9086-a49d-11ed-bfe3-dac502259ad0.png

当声音变大或变小了,模拟信号都会跟着变化,所以模拟信号有无数种状态。状态之间微妙的差异,需要人的经验判断,有点玄学的成分。

而数字信号永远只有0和1两种状态,信号的转换严格遵循逻辑关系,一个输出对应唯一确定的结果,程序完全依照输出指令执行,这是科学。

数字IC设计工程师的设计目标:在PPA(Power、Performance、Area)三个指标上追求完美的平衡。

怎么玩转这门科学?

这,是一种艺术。

今天,我们就从资源需求、并行特征、数据敏感度等角度展开聊聊在数字芯片设计各阶段,如何利用不同EDA工具的特点,让数字芯片的设计研发效率获得显著提升。

和模拟芯片相呼应,这篇还是从计算角度出发,至于调度/管理/数据/协同/CAD等视角,会在后面的文章里体现~(比如第三集

和模拟相比,数字芯片需要使用EDA工具的场景更多,IC工程师们对于计算机的使用天然比较亲近。但就跟《解密一颗芯片设计的全生命周期算力需求》一样,只负责某项工作的研发可能不关心,或者只了解自己的这部分,IT对业务所知有限,也不一定清楚。除非有大佬坐镇,大多数公司的日常大概是以拍脑袋经验论为主。

我们先来看一下大画面,数字芯片设计全流程分析图:

6f2955c2-a49d-11ed-bfe3-dac502259ad0.png

01

数字前端:前端设计/验证

这一阶段包含了规格制定、架构设计、RTL编码等步骤。 数字前端算法仿真和功能验证场景有大量中小任务并行,这一阶段,对于资源类型和用量通常无特殊需求。 不过需注意若大量使用现有IP通常没有算法仿真这一步。而且每家公司业务不同,算法仿真需求量差异非常大(下一集主角就是ta)。

02

数字中端:逻辑综合与DFT实现

这一阶段可分为逻辑综合、形式验证、门级仿真、ATPG验证等业务场景。 数字中端呈现单、多任务混合的特点,因为计算的输入数据中包含门延迟信息,输入数据变多,对内存的需求相比前端有一定增长。ATPG验证建议内存优化型,其他三种场景更加偏计算密集型。

03

数字后端:物理实现

这一阶段包括布局布线、形式验证、版图验证、寄生参数提取、后仿、ATPG验证、静态时序分析和IR分析等业务场景。 数字后端基本都是多任务,由于包含版图的寄生参数,信息量非常大,普遍需要大内存机器。其中,布局布线、后仿、静态时序分析、IR分析的大任务数量非常多,对主频也有要求,需要兼具高主频和大内存的资源。

资源需求

后端>中端>前端,数字后端·真·资源黑洞

把数字IC设计前、中、后端三大阶段进行资源需求对比。

7028ede8-a49d-11ed-bfe3-dac502259ad0.png

可以看到无论是任务运算时间、所需计算资源、存储需求还是IP与输入数据量级上,数字前中后端形成了非常明显的阶梯结构,整体资源需求呈现前端<中端<后端的趋势。  这是由三个阶段的具体工作内容决定的:

数字前端,用RTL代码将芯片架构师的设计写出来,前端验证也主要是针对RTL的功能进行验证,偏逻辑功能。

数字中端,需要将RTL代码综合成网表并规划、插入各种用于芯片测试的逻辑电路,需要加入Foundry厂提供的标准单元库的工艺参数,验证也到了逻辑门这一级。

数字后端负责芯片的物理实现,先将电路网表通过自动布局布线画成版图,再进行寄生参数提取,创建一个可以精确模拟数字电路响应的模型,这一阶段会加入版图的寄生参数。

从代码到逻辑门电路再到物理层,随着阶段的演进,信息量逐级递增,计算时所需消耗的资源量也随之增加。

而在28nm以及更先进制程下,包含的工艺参数更多,电路更复杂,前中后端每一阶段的信息量级还会被进一步放大。

703c7840-a49d-11ed-bfe3-dac502259ad0.jpg

哪怕前端RTL基本一致,中端和后端因为Foundry厂工艺参数更多更复杂,同样的代码计算量也是更大的。

换个思路,我们举个栗子。

通过一个在数字前中后端都会出场的EDA工具来看看三大阶段的资源需求。

VCS的主要作用是将Verilog HDL(一种硬件描述语言)转成C语言,编译出来并执行。作为一个翻译官,ta的工作量取决于双方对话的频率,以及需要翻译的文本量。

VCS在前端的功能验证、中端的门级仿真、后端仿真中都有出场,在不同阶段对任务资源的需求完全不同:

704d6a42-a49d-11ed-bfe3-dac502259ad0.png

从前端到中端再到后端,虽然VCS的工作性质没变,但整体来说,消耗的资源越来越多了。

综上,数字后端设计与验证环节相比中端和前端资源需求更高、运算时间更长、数据量更大,往往会占据整个项目周期资源需求量的50%以上。

下图是我们某客户全生命周期月度算力实际用量曲线,可以看到后端的波峰相当明显,详情戳:解密一颗芯片设计的全生命周期算力需求

70603780-a49d-11ed-bfe3-dac502259ad0.png

这也就意味着,数字后端对IC设计公司的压力相当大,能否在这一阶段获取充足的资源,是提升研发效率、保障项目进度的关键。

典型并行场景

静态时序验证&版图验证

并行度是我们评估任务能否通过分布式计算完成,提升效率的标准之一。 这里涉及到两个重要的判断标准:可拆分,互不干扰。可拆分指的是,大任务可以分解为小任务,原任务目标不变。

互不干扰指的是,拆分为小任务之后,任务之间互相不干扰,可以不同步。

从前端到中端再到后端,任务数量越来越多。

任务的并行度决定了速度提升的空间。

静态时序验证:最常见且并行度较高

静态时序验证是最常见的设计场景之一,基本原理是检查各信号通路上经过的门电路,然后累加门延迟,求取整个路径的信号延迟。

沿信号通路求Delay Time的过程,就是沿信号通路不停做简单加法。

在静态时序验证过程中,有一个PVT的概念。

我们需要验证逻辑门在不同的工艺(Process)、电压(Voltage)、温度(Temperature)条件下的延迟。

首先,列出可能的条件,如:

工艺:TT、FF、SS……

电压:0.9V、1.0V、1.1V……

温度:-40°C、0°C、25°C……

随后,穷举每一种可能性,如:

PVT1=TT、0.9V、-40°C

PVT2=TT、1.0V、25°C

PVT3=TT、1.0V、0°C

……

最后,验证逻辑门在每一种PVT条件下的延迟:

7097abc0-a49d-11ed-bfe3-dac502259ad0.png

数字芯片中有着无数这样的逻辑门,每一个PVT下,逻辑门都有对应的Delay Time,而P、V、T之间可以有很多种组合,就会有很多个Delay Time的情况需要验证。

这一场景,天然适合暴力堆机器。

版图验证:最高并行度

模拟芯片和数字芯片,这一场景的原理一模一样,使用的EDA工具也完全相同。

版图验证属于检查类任务,以模块为单位,本质上是数据对比工作,重内存需求,子任务间没有数据关联,是数字芯片设计与验证中并行度最高的场景。

这一阶段很适合利用云上的内存优化型资源,使用“小F影分身术”(版图分割术),通过暴力堆资源的方式快速完成任务。

70cb9f5c-a49d-11ed-bfe3-dac502259ad0.jpg

关于版图验证,我们在《芯片设计五部曲之一 | 声光魔法师——模拟IC》中有更详细的说明。

数据敏感度

前端>中端>后端,但是不用担心

我们按照数据敏感度从高到低的顺序给各类设计数据排了个序:RTL数据 > IP、PDK和版图> Netlist、Session、过程波形、归档数据和Report

好了,接下来我们看看这些数据都会出现在哪些阶段:

70dddffa-a49d-11ed-bfe3-dac502259ad0.png

数字前端有大量RTL代码,甚至部分公司在此过程中还自己开发了IP,属于数据安全等级最高的那一拨。许多公司都会严格管理这部分数据,设置一定的保密等级,甚至固定放在某几台机器上。

中端则涉及到部分的RTL代码、IP和PDK数据,以及一些Netlist、Session和Report。

后端彻底告别了代码,以IP、PDK、版图和数据敏感度较低的数据为主。

如果你要做一款游戏,前端相当于游戏的源代码,中端是详细的角色形象设计稿,后端就是玩家拿到手的游戏光碟了。

710e61fc-a49d-11ed-bfe3-dac502259ad0.jpg

前端泄密,恭喜你的对手达成“代码级抄袭”;

中端泄密,别人能照着样子把仿品做出来,但没有源代码参考,知其然不知其所以然;

后端泄密,等对方逆向明白,大半年时间也过去了,你的下一代产品已经在路上了。

值得一提的是,如果使用的是先进工艺,Foundry厂也会对IP/PDK数据有保密要求。

所以在选择云上业务场景的时候,我们一般优先推荐数字后端先来。当然,会根据每家公司的实际情况进行具体分析。(以后会写到,这次一定

那么,前端或者中端是不是就适合用云了呢?

甚至,在某些情况下,IC设计公司会面临全部数据无论敏感度高低必须存放在本地的情况,比如一些高保密项目(军工项目或国家重点项目),或者有点微妙的竞争关系,怎么办?

我们有针对性的存算分离解决方案,欢迎来对号入座。

存算分离解决方案到底是什么?我们是如何实现的?扫描文末二维码关注小F,对暗号“存算分离”抢先了解~

这里还有燧原科技的一手体验,戳此先睹为快:【案例】燧原科技:芯片设计“存算分离”混合云实践

关于数字IC设计,从不同设计阶段的计算任务视角出发,我们总结了四点:

1、与模拟芯片相似,数字芯片三大阶段的资源需求同样呈现前期<中期<后期的趋势,但数字芯片需要使用EDA工具的场景更多,整体资源需求更大;2、版图验证并行度最高,静态时序验证出场率非常高且并行度很高,都适合用暴力堆机器的方式提高任务效率; 3、数字后端往往会占据整个项目周期资源需求量的50%以上,兼具资源需求高、计算时间长、数据量级大,数据敏感度相对低的特征,是提升数字芯片整体研发效率的关键; 4、数据敏感度高?必须放本地?没关系,我们有解决办法。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模拟IC
    +关注

    关注

    8

    文章

    167

    浏览量

    29341
  • 数字IC
    +关注

    关注

    1

    文章

    37

    浏览量

    12493
  • 数字芯片
    +关注

    关注

    1

    文章

    106

    浏览量

    18365

原文标题:为什么数字芯片设计适合暴力堆机器?我来给你掰掰明白

文章出处:【微信号:数字ICer,微信公众号:数字ICer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    分享orcad暴力卸载和解决启动很慢的问题

    分享orcad暴力卸载和解决启动很慢的问题
    发表于 07-16 14:04

    LabView密码破解器暴力模式小程序

    LabView密码破解器暴力模式小程序,得重新去下载破解密码的字典
    发表于 12-18 10:33

    请问怎么运用stm32写防暴力拆卸破坏

    怎么运用stm32写防暴力拆卸破坏
    发表于 08-29 11:59

    何为暴力破解呢

    ps:代码复制黏贴即可,有什么问题下方留言,博主会及时回复 !工具:1:笔记本2:USB无线网卡(必备)3:kali系统4:靠谱字典暴力破解法:何为暴力破解呢,其实就是一个一个密码试,直到正确的密码
    发表于 07-15 09:46

    整流,什么是整流

    整流,什么是整流的检测 1. 全桥的检测 大多数的整流全桥上,均标注有“+”、“-”、“~”符号(其中“+”为整流后输出电压
    发表于 02-27 10:46 2118次阅读

    AI的暴力检测是什么?还存在什么问题?

    暴力检测”成为了当下的一个热门。在人群中实时检测“暴力行为”成为了现实,如果你想打架,最好先看看AI同不同意。
    的头像 发表于 06-20 14:47 4994次阅读

    FPGA是什么?数字芯片之母

    当FPGA 80年代出现后,很快就变成了各家数字芯片公司开发的必需品,没有FPGA之前,数字芯片开发出来只能直接在晶圆厂投片,如果设计时存在一些问题和隐患(这个在
    的头像 发表于 08-21 14:51 1.2w次阅读

    如何选择适合自己的语音机器

    究其根本原因,则是企业在语音机器人的选择上有些缺漏,那么,如何选择适合自己公司的语音机器人呢,看价格?比品牌?论技术?
    的头像 发表于 11-12 10:13 2122次阅读

    顺丰公布暴力分拣识别方法专利

    快递暴力分拣之所以屡禁不止,究其原因还是监督、管理不到位。顺丰日前公布了一项“暴力分拣识别方法”相关专利,试图从技术上提高暴力分拣识别的准确率。
    的头像 发表于 01-21 11:31 2298次阅读
    顺丰公布<b class='flag-5'>暴力</b>分拣识别方法专利

    什么是内存?内存是如何分配的?

    在一般的编译系统中,内存的分配方向和栈内存是相反的。当栈内存从高地址向低地址增长的时候,内存从低地址向高地址分配。
    的头像 发表于 07-05 17:58 9901次阅读

    基于机器视觉技术的料三维体积测量

    可以在固定料周围安装多个激光测距扫描仪,通过采集料各个面的局部高程信息,再结合扫描仪的安装位置进行料的整体三维估计建模,最终预估出料坑体积。
    发表于 11-09 20:58 1987次阅读

    亚马逊告诉机器人如何装货物

    亚马逊仓库在收到一批新货库存时,显然要做的事可能就是召唤一个移动机器人,用它充足的货架装所有物品。这样,有人订购一件物品时,刚刚装货的移动机器人就会出现,人们可以从货架上取出相应物品。然而,如果
    的头像 发表于 05-22 15:23 1001次阅读
    亚马逊告诉<b class='flag-5'>机器</b>人如何<b class='flag-5'>堆</b>装货物

    暴力猴浏览器插件

    暴力猴浏览器插件
    发表于 05-29 11:20 6次下载

    实战演练:Calibre如何成为暴力机器之王

    版图文件很大,需要处理的数据量非常大,但本身的逻辑判断并不复杂,所以通常不刚需高主频机型,但要求多核、大内存的机器。CPU与内存的比例通常能达到1:4或1:8,极端情况下这个比例会更高,2T或4T的超大型内存机器都有可能登场。
    的头像 发表于 07-17 15:25 658次阅读
    实战演练:Calibre如何成为<b class='flag-5'>暴力</b><b class='flag-5'>堆</b><b class='flag-5'>机器</b>之王

    的作用是什么?桥整流后电压是多少?

    的作用及工作原理解读 桥的作用是什么?桥整流后电压是多少?  桥是一种常用的电路,广泛应用于电力电子系统中。桥是一种全波整流电路
    的头像 发表于 08-24 15:17 7340次阅读