0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

怎么看见和定量分析验证平台的时间呢

工程师邓生 来源:杰瑞IC验证 作者:Jerry 2022-08-30 09:23 次阅读

我们说的“提速”到底提的是什么时间?

1、验证仿真中的“3个时间”

在验证仿真过程中,我们脑中需要闪过至少3个概念:

墙上时钟时间(wall clock time)

cpu时间(cpu time)

仿真时间(simulation time)

他们都是什么呢?

1.墙上时钟时间(wall clock time):

顾名思义,它是“挂在墙上的时钟”的时间,这个时间也就是我们真实世界真正“走过的时间”。

你跑一个case,对于linux系统来说,就是一个或多个进程,而这个wall clock time,它是进程运行的时钟总量。它除了包括cpu真正的运行时间之外,还包括了如:

就绪时间:

进程具备运行条件,但是还没有CPU资源可用。例如你提交了一个case,但是半天提不上去跑不起来,可能因为其他人的case太多,导致机器满载了,等别人释放了之后你的case才真正获得cpu资源运行起来。

阻塞时间:

例如你的case已经跑起来了,发现某个vip lisence不够了,“卡”到那里了。

或者例如你编译运行过程中因为磁盘不太充足出现的卡顿现象等。

2.cpu时间(cpu time):

当进程运行起来之后,占用cpu进行计算花费的时间。同样是代码在cpu上运行,依据代码类别不同,cpu时间也分为用户cpu时间和系统cpu时间。

用户cpu时间是代码在用户态(User Mode)运行的时间。

系统cpu时间是代码在内核态(Kernel Mode)运行的时间。

我们可以简单理解:依据代码权限不同,用户态执行用户代码,内核态执行的是操作系统代码。这里不深入展开了,感兴趣的朋友可以查阅一些资料(为什么这里要多引申提一下这个概念,主要帮没有听过这些概念的朋友,在仿真性能分析报告中如果碰到相关词汇,至少可以有一个简单的感性认知)。

此外,从前面的wall clock time解释可以看出,比如你的case被阻塞了、挂起了是不占用cpu时间的,但是真实时间还是继续走的。有兄弟可能会问:“照这么说,wall clock time是不是肯定是大于cpu time?”

答案是:不一定。

如果是多核处理器机器上,cpu总时间是所有不同线程或进程cpu时间之和,此时wall clock time时间就会比cpu总时间小了。其实依据wall clock time和cpu总时间的关系,也把进程分为计算密集型(wall clock time小于cpu time,有多核并行的优势)和I/O密集型(wall clock time大于cpu time,没有多核优势,很多等待时间)。

举一个例子,如下截图,VCS软件对于verilog设计部分的编译过程中,允许通过-j选项指定并行数量。在选择合适的并行数量的情况下,相关部分编译的wall clock time就会小于cpu time哦~

189de864-27e1-11ed-ba43-dac502259ad0.png

3.仿真时间(Simulation time)

仿真时间是仿真器维护的时间,就是我们波形中看到的那个多少ns多少ps那个时间,它显然不是仿真过程中真实的时间。这个时间是为了表示实际电路的运行时间,给电路仿真建模用的一个“数字”。

我们知道SystemVerilog是在值的更新、计算等一个个离散事件的相互触发“推着”往前走的(推着走的单位就是也就是我们之前讲过的global time precision,也就是timeslot)。

所以仿真时间长短和运行时间长短、仿真速度没什么关系,主要是看“步子”有多少。在其他所有因素都一样的情况下,谁的事件少、推的步子少谁仿真的速度也就更快。

再举个例子:`timescale 1ns/1ps 和`timescale 10ns/10ps,它们的time unit和time precision都同时扩大了10倍,但它们的比值是一样的,即“步子”数量是一样的。在其他背景完全一样的相同仿真单位度量情况下(这里指的不带具体单位,如,#1;前者代表运行1ns后者表示运行10ns),仿真速度是一样的。

Tips:我们说平台提速到底要提哪个时间?

刚才Jerry给大家抛出了验证仿真的“3个时间”,我们回到本系列文章“验证仿真提速”主题,抛出一下最底层的问题:我们追求“提速”,根本目标是想要减少哪个时间?

没错,我们追求的最根本目标是减少墙上时钟时间(wall clock time),即我们需要的是减少自己浪费的真实世界的时间,多跑几轮case或者早点跑出结果早下班。如果你费尽心思减少cpu time、仿真时间,最后wall clock time没有降下来对于我们有个毛线意义??虽然如前面有提到这3个时间有相关性,但是希望大家心中一定要明确我们的根本目标。

2、怎么看见和定量分析验证平台的时间?

有了前面的认知铺垫,我们回到实战。如何定量分析验证平台的时间和资源,我们以VCS工具为例(其他家工具大家自行探索),一般可以有两种抓取性能信息的方式,一种是以“轻量级”的方式输出编译和运行仿真过程中的性能汇总信息,一种是相对“重量级”的方式进一步详细分析仿真运行性能信息。第二种为什么说比较“重量级”呢?主要原因是它本身就会造成很大的时间消耗。我们都简要介绍一下:

1.以“轻量级”的方式输出编译和运行仿真过程中的性能汇总信息。

增加vcs编译选项: -reportstats

增加simv仿真选项:-reportstats

工具将会直接把编译和运行的汇总性能报告直接打印在屏幕上,我们示意性跑出来的一组截图如下:

18cd3cc2-27e1-11ed-ba43-dac502259ad0.png

18db4484-27e1-11ed-ba43-dac502259ad0.png

上面的主要细节vcs手册解释原文如下:

• VCS start time

• Elapsed real time: wall clock time from VCS start to VCS end

• CPU time: Accumulated user time + system time from all

processes spawned from VCS

• Peak virtual memory size summarized from all the contributing

processes at specific time points

• Sum of resident set size from all the contributing processes at

specific time points

• Sum of shared memory from all the contributing processes at

specific time points

• Sum of private memory from all the contributing processes at

specific time points

• Major fault accumulated from all processes spawned from VCS

我们本篇主要关心时间,有了前文的铺垫相信这里可以看得比较清楚了。

从上面的解释可知:Elapsed real time就是编译或运行阶段的墙上时钟时间(wall clock time),cpu time是vcs产生所有进程的用户cpu时间和系统cpu时间总和。

顺便,从这个举例的截图报告也可以明显看出wall clock time大于cpu time,没有任何多核优势,属于I/O密集型。

这里提一个点,我们前面讨论3种时间的时候可以了解到:即使是跑同样的case,用同样的种子,跑出来的时间统计信息也一定会因为磁盘状态等原因而不同。所以对于测试某种手段是否减少了总时间花费,是否有收益(尤其是不太明显的手段),单纯的通过前后两次跑同样的case,对比统计结果是不足以判别的,如果不是明显的提速手段,可能会出现使用后wall clock time和cpu time反而比使用前花费更多时间。但是如果基于相同的服务器等因素的状态,或基于统计的方式多次测试评估,就可以看出总体速度的提升趋势。

2.以相对“重量级”的方式进一步详细分析仿真运行的性能信息。

增加vcs编译选项 -lca -simprofile

增加simv仿真选项 -simprofile time

(这个仿真选项后面除了跟time观测仿真时间信息还可以加:如mem收集服务器内存消耗信息等,当然也可以如time+mem同时收集) 这些选项加了之后,工具会生成如下带“profile”关键词的文件和文件夹,我们主要看profileReport.html文件。

18ef5d8e-27e1-11ed-ba43-dac502259ad0.png

html文件打开后会发现分左右两个区域,通过左边区域可以控制出现在右边区域你想要看到的性能信息,示意图如下:

19116212-27e1-11ed-ba43-dac502259ad0.png

Jerry通过time+mem的选项,随意跑了一个case,相关的summary示意图如下:

192c6418-27e1-11ed-ba43-dac502259ad0.png

我们还是关心time,主要贴下time的相关copmponent的含义(下面有的条目在上图例子中不涉及,别的case也许就会有):

•CONSTRAINT

The CPU time needed to solve and simulate the SystemVerilog constraint blocks.

•KERNEL

The CPU time needed by the VCS kernel. This CPU time is separate from the CPU time needed to simulated your Verilog or SystemVerilog, VHDL, SystemC, or C or C++ code for your design and testbench.

•VERILOG

The CPU time needed by VCS to simulate this example’s SystemVerilog code, which is a program block. For Verilog and SystemVerilog there are sub-components.

•DEBUG

The CPU time needed by VCS to simulate this example with the debugging capabilities of Verdi and the UCLI or to write a simulation history VCD or FSDB file.

•Value Change Dumping

The CPU time needed by VCS to write a simulation history VCD or VPD file.

•VHDL

For VCS only, the CPU time needed to simulate the VHDL code design.

•PLI/DPI/DirectC

The CPU time needed by VCS to simulate the C/C++ in a PLI, DPI, or DirectC application.

•HSIM (Hybrid Simulation)

This is about the CPU time used by HSOPT (Hybrid Simulation Optimization). The HSIM bucket indicates the CPU time consumption of design constructs that are optimized by HSOPT. It has become prominent in GLS design/RTL. The HSIM cost is more with GLS design because most constructs are optimized by HSOPT. But it cannot be zero because there are some global HSIM activities.

•COVERAGE

The CPU time needed for functional coverage (testbench and assertion coverage). Code coverage is not part of this component.

•SystemC

The CPU time needed for SystemC simulation.

通过调节前面提到html左边区域选项,还可以看到更多的信息,如进一步查看仿真过程中rtl和tb各个模块层级花费的时间信息,这里就不多赘述了,其他的玩法大家感兴趣可以自己研究。

这种“重量级”的方式,虽然会拖慢仿真时间,但一个优势是收集的信息更加详细,可以更直观的看到各部分资源消耗百分比,更好的协助我们找到消耗时间的性能瓶颈,提供优化方向和缩小优化范围。

结语

我们今天围绕“时间”这个主题,首先讨论了验证仿真中的“3个时间”建立了基础认知,接着明确了平台提速到底要提哪个时间?最后以vcs工具举例了怎么收集和分析相关信息。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10854

    浏览量

    211578
  • 时钟
    +关注

    关注

    10

    文章

    1733

    浏览量

    131446
  • 多核处理器
    +关注

    关注

    0

    文章

    109

    浏览量

    19908

原文标题:验证仿真提速系列--认识“时间”与平台速度定量分析

文章出处:【微信号:处芯积律,微信公众号:处芯积律】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    FPD-link裕量分析程序(MAP)用户指南

    电子发烧友网站提供《FPD-link裕量分析程序(MAP)用户指南.pdf》资料免费下载
    发表于 11-26 15:49 0次下载
    FPD-link裕<b class='flag-5'>量分析</b>程序(MAP)用户指南

    基于LIBS技术的煤炭灰分、挥发分和热值定量分析及特征工程研究

    光谱进行了可解释性实验。 一、引言 煤质分析对于促进煤炭资源的合理利用具有重要意义,其中煤炭的灰分、挥发分和热值是影响燃煤电厂混煤入炉、炉膛燃烧等工作的关键信息。传统的LIBS光谱检测需要耗费很长时间从煤样光谱中筛选元
    的头像 发表于 11-20 11:05 141次阅读
    基于LIBS技术的煤炭灰分、挥发分和热值<b class='flag-5'>定量分析</b>及特征工程研究

    中国开发出基于可编程DNA水凝胶的纸基比距传感器

    纸基比距传感器是围绕纸基材料的功能化设计的,根据待测目标触发反应产生的可观测距离信号进行定性或定量分析,具有读数直观且操作简便等优点,是新兴的即时检测(POCT)装置。
    的头像 发表于 11-18 09:46 194次阅读
    中国开发出基于可编程DNA水凝胶的纸基比距传感器

    什么是成分分析

    解析成分分析技术成分分析技术涵盖了多种科学方法,用于精确地鉴定和测量产品或样本中的组成成分,包括它们的定性与定量分析。金鉴实验室拥有先进的成分分析设备和专业的技术团队,能够为客户提供高
    的头像 发表于 11-08 12:29 249次阅读
    什么是成分<b class='flag-5'>分析</b>?

    基于LIBS的马铃薯中铬元素定量分析方法研究

    样品,并调整实验参数采集马铃薯光谱数据;然后针对光谱数据中的噪声和基线漂移的问题对光谱数据进行前期处理;最后采用绝对强度法定量分析Cr元素,同时,计算模型评价指标以评估定量性能。通过实验和数据分析
    的头像 发表于 10-30 18:11 196次阅读
    基于LIBS的马铃薯中铬元素<b class='flag-5'>定量分析</b>方法研究

    定量光学气体成像的优势和工作流程

    FLIR光学气体成像热像仪能够快速、精确、安全地检测天然气、VOCs、SF6 、制冷剂、氨气和CO₂等气体泄漏,因此已广泛应用在油气田、炼油厂、石化厂和天然气发电厂等行业。其中先进技术——光学气体成像 (QOGI) 被证实是石油天然气行业定量分析气体泄漏的一种有效手段,具体详情详细说下!
    的头像 发表于 10-24 13:43 277次阅读

    基于LIBS的土壤中铜元素和铅元素定量分析

    利用激光诱导击穿光谱技术对掺杂Cu、Pb元素的土壤样品进行定量分析,寻找最优实验条件。实验使用直接定标法和内标法对元素特征谱线进行拟合,根据计算相关系数及检出限选择合适的数据处理方法。
    的头像 发表于 08-27 14:54 281次阅读
    基于LIBS的土壤中铜元素和铅元素<b class='flag-5'>定量分析</b>

    气体泄漏定量报警系统SF6 的组成——每日了解电力知识

    完成SF6定量分析,O2定量分析、温湿度测量功能;(2)、主机及辅助功能模块,主要完成各模块协调工作,显示、报警、启动风机等功能。 1、气体取样分析模块(如图所示) 功能与参数: 检测点:12路+1路零点校准;可扩充到20路;
    的头像 发表于 07-26 10:03 442次阅读
    气体泄漏<b class='flag-5'>定量</b>报警系统SF6 的组成——每日了解电力知识

    地物光谱仪在土壤中油脂分析中的应用

    优势。 工作原理 地物光谱仪通过测量土壤样品在不同波长下的反射光谱来分析其成分。土壤中的油脂会在特定波段上表现出独特的光谱特征,通过这些特征可以识别和定量分析土壤中的油脂含量。 分析方法 1. 样品准备 在进行土壤中
    的头像 发表于 05-28 11:38 435次阅读
    地物光谱仪在土壤中油脂<b class='flag-5'>分析</b>中的应用

    电能质量分析仪的应用领域

    电能质量分析仪,作为电力系统中不可或缺的重要工具,其应用已经渗透到我们日常生活的各个方面。无论是工业生产、商业楼宇还是电力系统本身,电能质量分析仪都发挥着至关重要的作用。本文将深入探讨电能质量分析仪的应用领域,以期为读者提供全面
    的头像 发表于 05-21 17:09 620次阅读

    电能质量分析仪的常见故障及原因分析

    电能质量分析仪作为电力系统中不可或缺的监测设备,其准确性和可靠性对于保障电网的稳定运行至关重要。然而,在实际使用过程中,电能质量分析仪可能会遇到各种故障,影响其正常工作。本文将对电能质量分析仪的常见故障及原因进行详细
    的头像 发表于 05-21 17:06 722次阅读

    电能质量分析仪的原理和特性

    电能质量分析仪是电力系统中不可或缺的重要工具,它能够对电网中的电压、电流、频率、谐波等参数进行实时监测和分析,以评估电网的电能质量。随着电力电子技术的快速发展和智能电网的深入推进,电能质量分析仪在
    的头像 发表于 05-21 17:04 1129次阅读

    片上中红外铟镓砷悬浮波导气体传感器研究

    大多数气体分子在中红外光谱范围(2.5~20 μm)内具有振动特征吸收峰,这一特性可应用于痕量气体检测和定量分析
    的头像 发表于 03-01 09:24 767次阅读
    片上中红外铟镓砷悬浮波导气体传感器研究

    示波器怎么看峰峰值

    示波器怎么看峰峰值? 峰峰值是指电信号波形在一个周期内的最大振幅差值。在示波器上,我们可以通过以下步骤来测量峰峰值: 1. 准备工作:首先,确保示波器已经正确连接到电路上,并且信号源已经启动并发
    的头像 发表于 01-23 14:45 1.2w次阅读

    利用拉曼光谱对用于制药的带状薄膜进行实时定量分析

    作为Otto H. York化学与材料工程系新泽西工程颗粒中心的创办负责人,他的研究和创新改善了用于制药、食品、电子和能源工业等领域的颗粒特性。除了工程微粒外,他和他的同事们还专注于模式识别和聚类分析
    的头像 发表于 01-15 06:34 273次阅读
    利用拉曼光谱对用于制药的带状薄膜进行实时<b class='flag-5'>定量分析</b>