0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

分享硬件加速仿真的 11 个谬论介绍和说明

西门子EDA 来源:djl 2019-10-11 17:54 次阅读

误解和谎言可以歪曲人们对硬件加速仿真的认知。这些错误认知包括:

1.硬件加速器是幕后的验证工具,仅用于需要更为严谨调试的最复杂的设计

在20世纪80年代末和90年代初硬件加速器刚出现时,这种说法的确没错。不过,在跨入21世纪之后,也就是过去15年来,情况全然不同。这一转变有赖于几次技术改进和创新。新架构、新功能和简化的使用方法推动了硬件加速器在半导体行业各个领域的部署应用,从处理器/图形扩展到网络、多媒体、存储、汽车和航空航天。

如今,硬件加速器被用于任何规模和任何类型的设计。它们可以验证硬件、集成硬件和嵌入式软件,也可以验证嵌入式软件和整个片上系统 (SoC) 设计。

2.项目团队因为使用硬件仿真加速器编译项目时间过长而避免使用硬件仿真加速器。在硬件仿真加速器上,建立设计平台和调试硬件仿真加速器硬件耗费了太多精力,和结果相比,得不偿失

同样,这一说法在多年前没错,现在却并非如此了。编辑技术的进步简化并提高了被测设计(DUT)到硬件加速器的映射。DUT准备、编辑以及硬件加速器上映射设计的过程曾非常耗时,现在已从数个月缩短为几天时间。如果设计复杂度较低或属于新的复杂设计的衍生,甚至只需一天。

3.硬件加速器的购置和维护成本高昂

过去确实如此,如今不全然是这样。考虑到现代硬件加速器的验证功能和灵活性,其购置成本简直不值一提。硬件加速器是迄今为止功能最多的验证引擎。它具备解决最复杂的调试情景所需的性能和能力,通常包括嵌入式软件内容。只要想想,90年代初每个门需耗费5美元,如今单位成本大约为每个门几美分甚至更少。

虽然听起来很奇怪,但是以周期为基础来计算,工具的多用性使硬件加速仿真成为最廉价的验证解决方案。

持有的成本也大幅下降。由应用工程师团队“在幕后”操作和维护硬件加速器的时代已一去不复返。产品的可靠性得到大幅提高,降低了几个数量级的维护成本。此外,其易用性也让它的用途简单明了。

4.硬件加速仿真仅用于电路内仿真 (ICE) 模式

需要了解的是,在ICE模式中,DUT被映射到硬件加速器之中,被目标系统所驱动,和最终流片出的芯片一致。这就是推动硬件加速仿真概念形成和发展的部署模式,换言之,就是通过物理目标系统产生的真实世界的激励来测试DUT。

虽然很多用户仍采用这一模式,但这并不是部署硬件加速器的唯一方式。除了ICE,硬件加速器还可用于多种仿真加速模式。此外,还可以通过PLI接口使用基于软件的测试平台驱动硬件加速器,虽然由于硬件加速受限而未得到广泛应用,但仍可用于缩短从软件仿真切换至硬件加速仿真的设计调用耗时。或者通过基于事务的接口(TBX或TBA)驱动硬件加速器,硬件加速系数达到与ICE相当的水平之后,这些接口的应用越来越普及,至少对于目前某些硬件加速器是这样。将可综合的测试平台与DUT一起映射到硬件加速器内部之后,硬件加速器便可用于独立模式(SAA)。它们还可以加快存储于板上或密切关联的内存的嵌入式软件的验证。此外,硬件加速器还可同时用于上述多个目的。

5.在基于事务的硬件加速模式中,硬件加速仿真毫无用处

人们对硬件加速器仍存在一种普遍的误解,即基于事务的方法不起作用,或者与ICE相比性能有限。这一概念源于20世纪90年代末的IKOS系统并且起了作用。Mentor Graphics在收购IKOS之后改进和推动了这一技术发展,命名为TBX,作为ICE的一种可行的替代方案。

新兴的仿真公司EVE(Emulation Verification Engineering)在创建时就采用硬件加速仿真作为主要部署模式。我曾在这家公司担任过总经理和营销副总裁。Mentor和EVE都证明了:基于事务的硬件加速模式不仅能起作用,其执行速度还能与ICE匹敌,甚至更快。

基于事务的硬件加速的另一个独特优势在于能够创建一个运行DUT的虚拟测试环境,支持特殊用例分析、假设分析等ICE无法实现的功能,例如Mentor Graphics的VirtuaLAB实施。VirtuaLAB在虚拟环境中将整个目标系统制成模型,例如 USB以太网HDMI

6.硬件加速器将替代HDL仿真器

这个说法不仅错误,而且永远不会发生。硬件描述语言(HDL)仿真器能够快速设置和编辑,并且具备固有的优势——灵活而全面的设计调试功能,使其成为业内独一无二的最佳验证工具,但其有一个重大的局限性:在设计规模扩大到某个程度,尺寸达到数亿个门时,它们会“筋疲力尽”,性能下降。硬件加速器正是在这个时候发挥作用。

分享硬件加速仿真的 11 个谬论介绍和说明

假定设计规模会继续扩大,而HDL仿真器对大规模设计的执行速度不会提高,那么硬件加速器将成为唯一可行的系统级设计验证手段。仿真器将继续用于知识产权(IP)和模块级。

您可能会问,那多机仿真呢?

在多机仿真中,大规模DUT不会分解成小块并分布到大量PC中,使一个工作站执行一小块DUT。这种方法已被重复尝试了25年多了,但结果并不尽如人意。

相反,多机仿真中的每个工作站会执行同一个设计的副本,和设计的大小相同。每份设计副本由功能完善且独立的不同测试平台执行。因此,设计规模仍起决定性作用。带有大规模验证平台的多机仿真被用于回归测试是非常流行的。

仿真器与硬件加速器的使用比率可能是80%比20%。据我估计,这个比例会在十年后反转,变成20%比80%。

7.硬件加速仿真和FPGA原型除了名称有别,本质并无不同。FPGA原型能够并且将取代硬件加速器

这是个错误的说法。虽然硬件加速器可以使用FPGA器件(事实上有一些硬件加速器确实使用了FPGA器件),但这两种是截然不同的工具。

FPGA原型的设计旨在实现尽可能最高的执行速度。在芯片设计的过程中,通常每一种验证原型会针对特定的设计加速而作优化。它们牺牲了DUT映射工作、DUT调试功能(限制到最低,常常毫无用处)以及调整灵活性和多用性。它们可用于芯片成功流片之前的嵌入式软件验证以及最终系统验证。

除了采用了基于定制的处理器、定制的片上硬件加速器和商用FPGA的技术,硬件加速器拥有的几个特性将其与FPGA原型电路板或系统区别开来。例如:

硬件加速器和FPGA原型系统在DUT映射和编辑耗时方面有着天壤之别,一个以天计算,一个以月计算。

硬件加速器针对硬件调试,因此支持100%的设计可见性,不要求探针编辑。不同的硬件加速器在这个关键性能上存在差异,但是和FPGA相比,这些差异微不足道。

硬件加速器可用于几个操作模式,支持从硬件验证和硬件/软件集成到固件/操作系统测试和系统验证的一系列验证目标。此外,它们还可用于多电源域设计验证,并且可以产生支持功率估算的切换活动。

硬件加速器还是多用户/多任务引擎。FPGA原型系统仅由一个用户使用,一次处理一个任务。

上文所述已说明了 FPGA 原型不会取代硬件加速器的原因。

8.硬件加速器必须安装在一个地点,不能远程使用,例如作为数据中心资源使用

早期的硬件加速器确实如此,如今已不再是这样。目前,所有的硬件加速器都可以远程访问。但是,在ICE模式中,这种方法太繁琐,在硬件加速器上传不同设计时需要人为监督来安装和切换速率适配器。事实上,ICE模式的多用户或多任务非常不利于远程访问部署。

尽管如此,ICE模式的多用户、远程访问(TBX/TBA或SAA)和大规模配置是硬件加速仿真数据中心的基础。显然,高效且顺利的操作需要管理软件,这就是各种硬件加速器实施的不同之处。

9.硬件加速仿真不支持SoC中的嵌入式软件验证,这意味着该手段无法实现硬件/软件协同验证

事实完全相反。硬件加速仿真是能够执行这项艰巨任务的唯一工具。

为验证嵌入式软件在底层硬件上(带单个或多个CPU的SoC)的交互,包括固件和操作系统,验证工程师需要以下三种要素:

周期精确的设计呈现,以跟踪SoC中任何地方的错误。硬件加速器可以提供最准确的设计呈现(在这方面和真实芯片相比只是缺少了硅晶片)。

可达到数百个千赫或兆赫的极高执行速度,越快越好。硬件加速器可以实现这个速度。

硬件设计完全可见。硬件加速器提供了100%的设计可见性,虽然不同硬件加速器的访问速度不同。

10.功率估算是一项关键的验证任务,但硬件加速仿真没有能力分析SoC的功耗

这又是一个错误的说法。功耗分析基于设计内部所有元素的切换活动跟踪。设计呈现得更细致,分析就更为准确。遗憾的是,更高的粒度水平意味着会消耗更多的硬件加速器资源,从而降低其灵活性,阻碍其做出能够改善功耗的重大设计变更。最好是从架构层级实现这一分析。

硬件加速仿真可以实现寄存器传输级(RTL)和现代SoC设计门级的最佳功耗分析。只有硬件加速仿真才有处理大量逻辑以及产生针对所有元素的切换活动的独有能力。

11.所有硬件加速器都是一样的

今天,所有硬件加速器有很多共同特性,都能够执行任务。不过,在特定模式下,有些硬件加速器会优胜于其他硬件加速器。

从架构的角度来看,硬件加速器之间的区别在于技术基础。以下是来自三个主要EDA供应商的三种商用产品:

基于定制处理器的架构:由IBM制定,是自1997年后经过验证的技术,在2000-2010十年间占主导地位。优势包括快速编辑、良好的可扩展性、在ICE模式下执行速度快、获得来自全面的速度桥接目录的支持,以及卓越的调试功能。缺点是在TBA模式下的执行速度有限、功耗大,并且物理尺寸比基于同等设计容量的商用FPGA的硬件加速器更大。

定制的片上硬件加速器架构:片上硬件加速器架构由一家名为Meta Systems的法国新兴公司在上世纪90年代中期率先设计出来,基于高度优化的定制FPGA,这种FPGA包含能够快速编辑的互连网络,并且可以实现“设计即正确”的编辑。设计可视化在硅片上实现,提供100%的可见性,不要求探针编辑和快速的波形跟踪。它有几个缺点:需要多个工作站进行快速编辑;相比基于同等设计容量的商用FPGA的硬件加速器而言,速度更慢,物理尺寸更大。

基于商用FPGA的架构:首次使用时间是20世纪90年代,因为几个缺点而不及基于定制处理器的架构。过去10年,超大的新一代商用FPGA帮助克服了旧的商用FPGA的很多弱点,其物理尺寸和功耗在同等设计容量的架构中均属最小值。与其他两种架构相比,它可以获得更快的执行速度。最大的一个缺点是在至少1,000万门或更低的设计中,其编辑速度低于其他两种架构。这种设计完全可见的实现以牺牲较高的硬件仿真速度为代价。

这三种架构都具备可扩展性,能够处理任何设计规模,小至IP模块,大到超过十亿门级的整个系统。它们支持多用户,其中,基于定制处理器的架构可以容纳最多的用户。它们还支持所有部署模式和验证目标。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 寄存器
    +关注

    关注

    31

    文章

    5336

    浏览量

    120230
  • 加速器
    +关注

    关注

    2

    文章

    796

    浏览量

    37838
收藏 人收藏

    评论

    相关推荐

    基于Xilinx XCKU115的半高PCIe x8 硬件加速

    基于Xilinx XCKU115的半高PCIe x8 硬件加速卡,支持2x72bit(数据位宽64bit+ECC)DDR4存储,数据传输速率 2400Mb/s。DDR4单簇容量4GB,两组总容量为8GB
    的头像 发表于 11-14 11:30 251次阅读
    基于Xilinx XCKU115的半高PCIe x8 <b class='flag-5'>硬件加速</b>卡

    RISC-V跑AI算法能加速吗?

    现在好多ARM单片机都带机器学习加速,RISC-V有这方面的硬件加速吗?
    发表于 10-10 22:14

    TDA4VM上的硬件加速运动恢复结构算法

    电子发烧友网站提供《TDA4VM上的硬件加速运动恢复结构算法.pdf》资料免费下载
    发表于 09-24 11:39 0次下载
    TDA4VM上的<b class='flag-5'>硬件加速</b>运动恢复结构算法

    AM62A SoC通过硬件加速视觉处理改进条形码读取器

    电子发烧友网站提供《AM62A SoC通过硬件加速视觉处理改进条形码读取器.pdf》资料免费下载
    发表于 09-04 09:52 0次下载
    AM62A SoC通过<b class='flag-5'>硬件加速</b>视觉处理改进条形码读取器

    适用于数据中心应用中的硬件加速器的直流/直流转换器解决方案

    电子发烧友网站提供《适用于数据中心应用中的硬件加速器的直流/直流转换器解决方案.pdf》资料免费下载
    发表于 08-26 09:38 0次下载
    适用于数据中心应用中的<b class='flag-5'>硬件加速</b>器的直流/直流转换器解决方案

    为什么drv2700做仿真时放大倍数和说明书不一致?

    我准备做个压电电机驱动,按照drv2700说明书上连接电路选择参数后在Tina仿真的放大倍数结果与说明书都有区别。我不知是我的电路参数错误还是本来就会有这样的。如我设置11时是40.
    发表于 08-12 07:20

    PSoC 6 MCUBoot和mbedTLS是否支持加密硬件加速

    。 使用 MCUBoot 验证两应用程序时,运行时间大约需要五秒钟。 在 README.md 的 \"安全 \"一栏中写道 与软件实现相比,硬件加速加密技术将启动时间缩短了四倍多
    发表于 05-29 08:17

    西门子数字化工业软件推出Veloce CS硬件辅助验证和确认系统

    创新的 Veloce CS 架构整合了硬件加速仿真、企业原型验证和软件原型验证,将验证和确认周期加快 10 倍,整体成本降低 5 倍
    的头像 发表于 05-08 14:28 708次阅读

    新思科技硬件加速解决方案技术日在成都和西安站成功举办

    近日,【新思科技技术日】硬件加速验证解决方案专场成都站和西安站顺利举行,来自国内领先的系统级公司、芯片设计公司以及高校的250多名开发者们积极参与。
    的头像 发表于 04-19 17:35 446次阅读

    Elektrobit利用其首创的硬件加速软件优化汽车通信网络的性能

    Elektrobit今日宣布推出 EB zoneo GatewayCore——首款支持、配置和集成现代微控制器新一代硬件加速器的软件产品,可应用于先进的汽车电子/电气架构(基于被广泛采用
    的头像 发表于 04-17 09:51 356次阅读

    用DE1-SOC进行硬件加速的2D N-Body重力模拟器设计

    该项目的目标是创建一用DE1-SOC进行硬件加速的2D N-Body重力模拟器。
    的头像 发表于 04-09 11:08 548次阅读
    用DE1-SOC进行<b class='flag-5'>硬件加速</b>的2D N-Body重力模拟器设计

    330-基于FMC接口的Kintex-7 XC7K325T PCIeX4 3U PXIe接口卡 图形图像硬件加速

    标签: Net FPGA , XC7K325T板卡 , XC7K325T处理板 , 软件无线电处理平台 , 图形图像硬件加速
    的头像 发表于 03-04 14:14 616次阅读
    330-基于FMC接口的Kintex-7 XC7K325T PCIeX4 3U PXIe接口卡 图形图像<b class='flag-5'>硬件加速</b>器

    【国产FPGA+OMAPL138开发板体验】(原创)7.硬件加速Sora文生视频源代码

    完成,准备输出视频帧 // 调用硬件加速模块进行文本到视频帧的转换 // 将文本缓冲区的内容“传递”给硬件加速器 // TextToVideoHardwareAccelerator 是一硬件
    发表于 02-22 09:49

    音视频解码器硬件加速:实现更流畅的播放效果

    随着多媒体内容的日益丰富和高清化,传统的软件解码已经难以满足人们对流畅播放体验的需求。因此,音视频解码器硬件加速技术的出现,为提升播放效果带来了革命性的改变。 硬件加速的原理 硬件加速的核心
    的头像 发表于 02-21 14:40 953次阅读
    音视频解码器<b class='flag-5'>硬件加速</b>:实现更流畅的播放效果

    KubeCASH:基于软硬件融合的容器管理平台

    、CSI、CDI等接口都奉行一重要的原则:“不做事,就不会犯错”。K8S可以理解成嵌于整个软硬件堆栈的一薄层,仅仅提供硬件到容器环境的一
    的头像 发表于 01-08 10:16 1278次阅读
    KubeCASH:基于软<b class='flag-5'>硬件</b>融合的容器管理平台