0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

HPC硬件的设计面临哪些挑战

lPCU_elecfans 来源:电子发烧友网 作者:电子发烧友网 2022-09-07 09:43 次阅读

电子发烧友网报道(文/周凯扬)晶体管的复杂程度持续走高,加上晶圆厂不断增加的设计规则,不少IC设计公司都发现自己陷入了一个你追我赶的境地。半导体设计如今需要额外的高性能计算资源才能保证开发的速度和质量,一旦这些资源没到位,工程师就都会受到限制,他们自己开发的硬件在追逐性能目标的同时,手头的设计工具也提出了一个不低的性能指标。

行业面临的设计挑战

如今芯片设计面临着诸多挑战,成本与良率、晶体管效率、裸片尺寸限制以及功耗与性能的取舍等等。这些挑战对任何公司来说都是需要攻克的难关,就拿AMD来说,在他们的芯片设计中,预计2023年的逻辑门数将是2013年的225倍,要完成这样的设计工作,所以无论是EDA还是FPGA都得加入这轮军备竞赛,而且产品发布周期和质量目标使得AMD必须保持这个节奏。

晶体管数量对EDA提出了更高的要求,比如AMD的Versal Premium ACAP拥有920亿晶体管,未来将发布的Instinct MI300拥有1460亿晶体管,而这种晶体管密度下的设计并不是单靠制造工艺的演进就能解决的。以晶圆厂和EDA厂商不断强调的DTCO(设计与工艺协同优化)为例,在台积电给出的数据中,5nm到16nm这个范围内,面积上的改进基本都是靠制造工艺的提升,而到了3nm这个节点,DTCO所占功劳已经近乎一半。

可如果不通过高性能计算硬件的辅助,是难以实现这等量级的设计自动化的。尤其是在先进工艺的后端设计上,需要更多的多线程运算、更长的运行时间,也面临着更大的内存和数据压力。

HPC硬件带来的改变无论是高性能多核CPU,还是最新GPUASIC加速器,都为EDA带来了性能上的飞跃。比如利用Ansys的EDA工具在应用AMD的Instinct GPU后,其求解器速度提高了三到六倍,而Epyc 7003处理器的超大三级缓存,也让其在仿真工具负载上有了1.48倍的性能提升。

另一个显而易见的趋势,就是HPC与AI的交集。过去的HPC节点中,x86处理器才是负责各种工作负载的主体。尽管如今这一点并没有改变,但我们可以看到AI已经成了HPC上不可或缺性能指标,所以无论是特定域加速的AI加速器还是GPU,也都在HPC机器上普及,EDA也同样因此受益。

比如通过AI将验证和测试线性化,从而直接预估综合的结果质量,减少对仿真的需求,又或是利用生成式AI来扩展设计空间和完成自动优化,以及通过AI来完成掩模优化,进一步提高良率等等,而这些都需要HPC硬件拥有一定的AI计算能力,才能满足EDA愈发算法化的自动化工作。

更何况就连GPU本身的设计也开始用上AI,以英伟达的Hopper H100 GPU为例。英伟达在设计H100的算数电路时用到了深度强化学习模型PrefixRL,在整个H100的架构中,就有近13000个实例是完全由AI来设计的。

可打造这样一个模型需要的硬件资源也不可小觑,比如每个GPU的物理仿真需要用到256个CPU,训练一个64位加法器电路就需要32000个GPU工时。但结果是喜人的,PrefixRL AI设计出来的加法器电路与最先进的EDA工具设计的电路性能和功能相当,但面积却小上25%。可以看出在AI这块,就连EDA厂商自己也还有不少提升的空间。

云端HPC的加入可在HPC硬件如此高昂的价格下,不少IC设计公司,尤其是初创企业,都望而却步,因为他们承受不起打造这样一个基础设施的成本,比如有的EDA公司的专用硬件加速服务器就要千万元一台。哪怕自己有达标的硬件资源,也不像EDA厂商预优化的硬件平台那样高效。

所以EDA厂商纷纷与云服务厂商合作,开始打造EDA的云HPC平台,云端按需使用的付费模式和对HPC硬件资源的灵活分配,大大降低了设计成本。像亚马逊这样自己也投身半导体行业的云服务厂商,每年也会完成多次流片。为了展示HPC云实例的性能,他们拿自己来作为范例,AWS的Gravition、Inferentia等服务器芯片,从RTL到GDS2,也都是全部在AWS云上完成的。

结语HPC硬件的设计离不开先进的EDA软件工具,可越来越复杂的设计要求,也使得EDA工具开始依赖HPC硬件才能发挥全部优势,这种闭环推动了整个半导体行业延续并超越摩尔定律。而下个时代迎来了Chiplet和3D封装,也为EDA带来了布线、时序和信号完整度等方面的更大挑战,为了迎接这一挑战,也是时候加大在EDA硬件上的投入了。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19264

    浏览量

    229666
  • 硬件
    +关注

    关注

    11

    文章

    3315

    浏览量

    66203
  • 晶体管
    +关注

    关注

    77

    文章

    9684

    浏览量

    138086
  • HPC
    HPC
    +关注

    关注

    0

    文章

    315

    浏览量

    23755

原文标题:​节节攀升的EDA硬件要求

文章出处:【微信号:elecfans,微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    云计算HPC软件关键技术

    云计算HPC软件关键技术涉及系统架构、处理器技术、操作系统、计算加速、网络技术以及软件优化等多个方面。下面,AI部落小编带您探讨云计算HPC软件的关键技术。
    的头像 发表于 12-18 11:23 74次阅读

    云计算和HPC的关系

    尽管云计算和HPC在架构、应用场景和成本效益等方面存在显著差异,但云计算和HPC之间并非孤立存在,而是相互补充、协同发展的关系。下面,AI部落小编带您探讨云计算和HPC的关系。
    的头像 发表于 12-14 10:35 89次阅读

    产业"内卷化"下磁性元件面临的机遇与挑战

    面对产业内卷的大环境,磁性元件行业究竟面临着怎样的机遇与挑战?企业又该如何在利润空间不断紧缩的夹缝中求生存、谋发展? 伴随市场环境的日益复杂多变,以及消费者需求的多元化与精细化,磁性元件产业逐渐步入
    的头像 发表于 12-05 11:09 124次阅读
    产业&quot;内卷化&quot;下磁性元件<b class='flag-5'>面临</b>的机遇与<b class='flag-5'>挑战</b>

    机器视觉要面临挑战及其解决方法

    机器视觉是指使用计算机和图像处理技术从图像中提取信息,并将其转换为机器可理解的格式。这种方法已经被广泛应用于自动化生产、质量控制、测量和检测等领域。然而,机器视觉仍然面临着一些挑战,需要采取相应
    的头像 发表于 11-11 01:03 221次阅读

    云计算hpc的主要功能是什么

    云计算HPC(High-Performance Computing)是指利用云计算技术来实现高性能计算的一种解决方案。云计算HPC将高性能计算能力以云服务的形式提供给用户。
    的头像 发表于 10-22 10:20 197次阅读

    HPC云计算前景

    高性能计算(HPC)与云计算的结合,正逐步成为推动科技创新和产业升级的重要引擎。随着数据规模的不断扩大和计算需求的日益复杂,HPC云计算展现出了巨大的潜力和价值。
    的头像 发表于 10-16 10:17 226次阅读

    云计算hpc是什么意思

    云计算HPC(High-Performance Computing)是指利用云计算技术来实现高性能计算的一种解决方案。
    的头像 发表于 10-15 10:01 273次阅读

    解析当代硬件工程师面临的可靠性设计挑战与应对策略

    硬件电路可靠性设计硬件电路可靠性设计在多个关键行业中至关重要。电子产品制造业、工业控制与自动化、航空航天以及医疗设备领域,都对硬件稳定性和长期可靠性有严格要求。工程师在面对这些挑战时需
    的头像 发表于 06-27 08:17 935次阅读
    解析当代<b class='flag-5'>硬件</b>工程师<b class='flag-5'>面临</b>的可靠性设计<b class='flag-5'>挑战</b>与应对策略

    AI是把双刃剑,HPC面临的全新机遇与挑战

    电子发烧友网报道(文/周凯扬)高性能计算也就是HPC(High Performance Computing),是一种利用超级计算机或高性能计算机集群的能力实现并行计算,以处理标准工作站无法完成的数据
    的头像 发表于 05-11 00:11 3625次阅读
    AI是把双刃剑,<b class='flag-5'>HPC</b><b class='flag-5'>面临</b>的全新机遇与<b class='flag-5'>挑战</b>

    全光网应用面临挑战

    尽管全光网络具有诸多优势和广阔的应用前景,但在实际应用中仍然面临一些挑战,例如: 成本挑战:全光网络的建设和维护成本相对较高,包括光纤敷设、光交换设备和光传输设备等硬件设备的采购和维护
    的头像 发表于 05-09 11:03 527次阅读

    硬件工程师在可靠性设计中所面临挑战及解决之道

    Course硬件电路可靠性设计HardwareEngineer硬件电路工程师在进行可靠性设计时,常常会陷入一系列烦恼之中。这些挑战包括成本、时间压力、可靠性预测的不确定性、复杂性增加以及设计限制等
    的头像 发表于 03-23 08:16 971次阅读
    <b class='flag-5'>硬件</b>工程师在可靠性设计中所<b class='flag-5'>面临</b>的<b class='flag-5'>挑战</b>及解决之道

    看一下通过采用HPC方法来解决汽车行业工程挑战的两个具体实例

    大家可能都知道,将Ansys解决方案与高性能计算(HPC)相结合,可带来巨大的投资回报(ROI)。接下来,让我们来看一下通过采用HPC方法来解决汽车行业工程挑战的两个具体实例。
    的头像 发表于 03-12 14:29 554次阅读

    什么是HPC高性能计算

    高性能计算(HighPerformanceComputing,简称HPC),是指利用集群、网格、超算等计算机技术,通过合理地组织计算机资源以及运用适合的算法和程序,提高计算效率和处理能力,实现对大量
    的头像 发表于 02-19 13:27 844次阅读
    什么是<b class='flag-5'>HPC</b>高性能计算

    O-RAN技术面临的的挑战

    Open RAN全球论坛是由RCR Wireless News主办的一年一度的盛会,吸引了行业领导者齐聚一堂,共同讨论该领域的进展和面临的最大挑战。LitePoint 的 Adam Smith
    的头像 发表于 01-22 10:20 637次阅读

    面临挑战 硅以外的半导体材料选择

    随着技术的快速发展,硅作为传统半导体材料的局限性逐渐显现。探索硅的替代材料,成为了科研领域的重要任务。在本文中,我们将探讨硅面临挑战以及可能的替代材料。
    的头像 发表于 01-08 09:38 1110次阅读