0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习让存储器设计提速N个数量级

星星科技指导员 来源:synopsys 作者:synopsys 2023-05-25 14:33 次阅读

电脑时谁不想要个大内存呢,其他电子产品的存储器需求也是如此。大存储器对于像自动驾驶智能设备这类被AI和ML技术加持的高性能计算应用则更加重要,因为它们通常需要实时计算结果,这个数据量可想而知。随着这类数据密集型应用日益普及,芯片开发者需要快速生成衍生设计和不同版本,才能更好地满足终端用户需求。

因此,存储器件变得容量越来越大,设计越来越复杂。在开发存储器件时,怎样做才能既满足严苛的性能、功耗、面积(PPA)目标,又能确保产品按时上市呢?

先进的存储器设计需要不一样的开发流程

当今的存储器会更多地采用2.5D/3D结构的multi-die设计,这类架构十分具有挑战性。

以完整的存储器阵列为例,在设计先进的高带宽(HBM)DRAM或3D NAND闪存芯片时必须要考虑晶粒之间的互连以及电源分配网络(PDN),以便针对PPA和硅可靠性进行优化。

传统的存储器设计和验证技术已经无法支持先进的存储器件设计了。仿真大型阵列非常耗时,并且由于周转时间过长,会导致产品上市延迟。另外,在流程后期发现设计问题时,解决问题需要使用手动迭代循环,还会进一步导致延迟。

存储器设计和验证过程的“前移”是应对上述挑战的唯一方法。存储器设计前移让开发者们可以更早地执行更好的分析,避免流程后期出现意外,并最大限度地减少迭代。

通过前移还可以避免存储器开发中影响整体周转时间和上市时间的四个关键瓶颈:宏单元特征提取、模块设计优化、版图前到版图后的仿真差距,以及定制版图设计。首先来逐一探讨下这四个瓶颈。

AI+ML,打破存储器设计瓶颈

瓶颈1:宏单元特征提取

存储器宏单元特征提取需要蒙特卡洛仿真,但在设计先进的存储器时,执行详尽蒙特卡洛仿真所需的时间和资源会大大增加,这使得其成为一个难以实现的解决方案。为了实现高西格玛特征提取并确保设计的稳健性,需要运行数十亿次的仿真。

机器学习技术恰好可以在这方面发挥作用。高精度的设计替代模型经过训练,能够预测高西格玛电路行为。通过采用该模型,可以显著减少仿真运行次数。

根据公开的案例分析,与传统方法相比,这种方法可以实现100-1000倍的加速,同时能够提供精度在1%以内的黄金SPICE结果。

wKgZomRvBt-APRp0AAD-IU20rdg513.png

瓶颈2:模块设计优化

在存储器设计项目中,导致周转时间和上市时间延长的主要因素是需要根据分析结果来迭代更改设计。传统的流程是,先决定拓扑结构,再选择晶体管尺寸和R/C值等设计参数,接着对设计进行仿真,然后是检查输出。如果结果不符合项目的PPA目标,则必须调整参数,重新进行仿真并重新评估结果。这种手动迭代循环会占用宝贵的开发资源并导致进度延误。

针对这一挑战,如果机器和算法能自动优化设计,情况会怎么样呢?

近年来,我们已经看到设计空间优化作为一个完整的人工智能驱动工作流程出现在数字设计中。人工智能代理能够自动选择器件参数,运行仿真,从结果中学习并进行微调,从而以迭代方式收敛到正确的器件参数集。

依靠AI驱动的设计优化,可以显著减少手动工作,更快地实现设计目标,速度提升好几个数量级。

wKgZomRvBuWAUFbLAAGYrRw935o459.png

瓶颈3:版图前到版图后的仿真差距

导致周转时间和上市时间延长的另一个主要迭代来源是版图前到版图后的仿真差距。开发者希望在版图之前尽可能准确地预先提取寄生参数对时序、功耗、噪声和稳定性等设计规格的影响,从而避免在从版图中提取寄生参数时出现意外。不幸的是,在传统流程中,这些类型的意外很常见,从而导致需要重复版图和仿真。

对此,解决办法是什么呢?

那就是早期寄生效应分析工作流程。通过该流程,可以准确地估算预版图和部分版图设计中的净寄生参数。根据公开的案例分析,通过使用早期寄生效应分析工作流程来预先提取寄生参数,可将设计中版图前后的时序差异从20-45%降低到0-20%。

有一项新兴技术在这方面表现出了巨大前景,那就是利用机器学习通过预测互连寄生效应来进一步增强早期寄生效应分析工作流程。

wKgZomRvBuyAKQqQAAGM9DKfAas285.png

瓶颈4:定制版图

虽然加快存储器设计的仿真和分析速度是实现设计流程前移的重要一环,但是在定制版图阶段也同样有机会来减少花费的时间和精力。在存储器设计中,经常会重复出现相同的子电路拓扑。这样一来,便可以由专业开发者提取布局布线模式来创建成模板,然后其他开发者可以重复使用这些现成的模板。初级开发者可以利用这些模板,根据所需的任何设备尺寸创建新的版图。这样不仅可以节省时间,还可以让初级开发者从原始版图所体现的专业知识和经验中受益。

根据公开的案例分析,无论开发者的经验如何,通过创建和使用模板,存储器中关键模拟电路的版图周转时间可以缩短50%以上,并且版图质量会更加一致。

机器学习技术代表着版图设计的下一个前沿,能够实现模拟布局布线自动化,并推动版图效率进一步提高。

wKgZomRvBvKALRuJAALPmpe1JS0097.png

实现存储器开发前移的最佳方法

新思科技定制设计系列中提供了上述所有相关技术,能够帮助开发者克服这四个主要的存储器设计和验证瓶颈。

新思科技PrimeSim™连续电路仿真技术提供了机器学习驱动的高西格玛蒙特卡洛仿真和一致的工作流程,消除了点工具流程中固有的麻烦和不一致。

与新思科技PrimeWave™设计环境相结合,PrimeSim解决方案还能提供早期寄生效应分析。此外,新思科技Custom Compiler™设计和版图解决方案全面支持基于模板的设计再利用。

结语

芯片的每一次更新换代,都意味着存储器设计和验证会变得愈加具有挑战性。新思科技拥有所有相关技术,助力开发者们实现存储器设计前移,缩短周转和上市时间,并实现开发者们所期望的PPA。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储器
    +关注

    关注

    38

    文章

    7484

    浏览量

    163765
  • 人工智能
    +关注

    关注

    1791

    文章

    47183

    浏览量

    238266
  • ML
    ML
    +关注

    关注

    0

    文章

    149

    浏览量

    34642
收藏 人收藏

    评论

    相关推荐

    使用tina测量opa227的输入失调电压和失调电流,结果数量级和手册标准值差很多,为什么?

    使用tina测量opa227的输入失调电压和失调电流,发现结果数量级和手册标准值差很多,这两个参数的测量电路用得都是书上的参考电路,不知道什么地方出了问题,麻烦各位帮忙看看,谢过! 电路和测量数据在附件中。
    发表于 09-14 07:59

    抗辐射加固封装国产存储器的电子辐照试验

    比普通封装存储器28C256提高1~2个数量级,为商用成品(Commercial Off-The-Shelf,COTS)器件在空间领域中的应用提供了技术支撑。【关键词】:抗辐射封装;;屏蔽;;存储器
    发表于 04-22 11:44

    labview的采样率上限数量级是10^6吗?

    这意味着labview的采样率上限数量级是10^6吗?
    发表于 09-28 13:05

    使用Matlab捕获N9010A跟踪数据缩放了几个数量级

    与显示类似,并且缩放了几个数量级。我必须有数据转换问题,但我无法弄清楚我做错了什么。使用下面的相关代码以32位整数格式捕获数据:+%通过GPIB连接到N9010A信号分析+ + obj = gpib
    发表于 11-05 10:42

    请问AD9361跳频稳定时间是一个什么数量级

    我看AD9361的UG上面有关于RF DC OFFSET的矫正时间计算公式,但是还是不太清楚。请问当跳频范围超过100M时,RF DC offset 跟跳频范围相关的时间在一个什么数量级呢,AD9361在GHz跳频的时候总共需要的矫正时间是一个什么数量级呢,谢谢
    发表于 02-15 14:39

    开关电源的NTC阻值一般是什么数量级的?

    ACDC开关电源的整流桥后串接的NTC,应是防止冷启时的浪涌电流的吧。1、用在此处的NTC的阻值一般是何种数量级的?2、看一国外客户使用的是EPCOS的用于测温用途的NTC(25摄氏度阻值为1K,B
    发表于 10-09 07:35

    MRAM如何实现对车载MCU中嵌入式存储器

    的擦除操作,而且写人时间也比闪存少几个数量级。即使是与现有存储器中性能较高的DRAM(读取1写入时间为30ns~
    发表于 02-11 07:23

    如何实现处理的速度跟外围硬件设备的速度在一个数量级上呢

    0 前言众所周知,处理的速度跟外围硬件设备的速度往往不在一个数量级上,因此,如果内核采取处理向硬件发出一个请求,然后专门等待回应的办法,显然降低内核效率。既然硬件的响应这么慢,那
    发表于 02-11 07:03

    传感检测精度再度提高,检测精度和分辨率提升了2个数量级

    复旦大学朱晓松博士课题组提出采用光强检测SPR传感方式(如图1),利用单色光的入射并检测传感的输出光强与折射率的关系,在灵敏度与波长检测型传感相当的条件下,检测精度和分辨率提升了2个数量级。具体研究成果发表在光学学报第六期。
    发表于 10-27 11:18 2697次阅读

    AI赋能下的当下与未来,人脸识别的准确度已经提升了4个数量级

    商汤研究院院长王晓刚日前表示,2014年,人工智能人脸识别技术的准确率首次超过人眼准确率,但目前,误差率已经可以达到亿分之一。机器做人脸识别如果相当于一个4位密码,现在则相当于一个8位的密码,人脸识别四年内准确度已经提升了4个数量级
    的头像 发表于 02-02 09:06 5521次阅读

    存储创新技术正焕发着勃勃生机

    英特尔等公司推出了非易失性随机访问存储器(NVRAM),这些存储器在电源断电后仍然能够保持数据。由于NVRAM位于服务的内存总线上,因此比磁盘或SSD快几个数量级
    发表于 07-01 16:17 690次阅读

    中国电子系统2天时间建设苏州市疫情管控平台 可同时支持10万数量级企业及1000万数量级员工的活动轨迹分析

    飞腾公司发布信息称,他们研发的16nm 64核FT -2000+/64处理已经用于苏州疫情管控平台,只用2天时间就搭建出一套能够满足10万+企业、1000万数量级员工的平台。
    的头像 发表于 03-03 15:12 3733次阅读

    英伟达已首次实现SDF实时渲染 速度提升2-3个数量级

    ,至少要在 1/24 秒以内,才不至于有 “翻 PPT”的感觉。 近日,英伟达发表一项最新研究成果将实时渲染速度提升了 2-3 个数量级。 而在渲染质量上,它也能够更好地处理复杂样式、比例的图形数据,甚至实时同步环境光照可能形成的阴影。
    的头像 发表于 02-01 09:42 1792次阅读
    英伟达已首次实现SDF实时渲染 速度提升2-3<b class='flag-5'>个数量级</b>

    兼顾PPA和上市时间,机器学习存储器计提速N个数量级

    买电脑时谁不想要个大内存呢,其他电子产品的存储器需求也是如此。大存储器对于像自动驾驶和智能设备这类被AI和ML技术加持的高性能计算应用则更加重要,因为它们通常需要实时计算结果,这个数据量可想而知
    的头像 发表于 12-12 20:40 466次阅读

    清华电化学电容新突破,比容量高出电解电容两个数量级

    相对来说,电化学电容器的比容量要比电解电容器高三个数量级,是微型化、集成化滤波电容的良好选择,但受限于缓慢的离子迁移动力学,电化学电容器无法做到滤波需求的高频率响应能力,因此电化学电容器往往需要以牺牲比容量的方式
    的头像 发表于 12-06 15:39 814次阅读
    清华电化学电容新突破,比容量高出电解电容两<b class='flag-5'>个数量级</b>