0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

VisualSim在多核嵌入式环境中预测和表达多个场景展示

星星科技指导员 来源:嵌入式计算设计 作者:Deepak Shankar 2022-11-21 16:42 次阅读

在这个由两部分组成的系列的第 1 部分中,我们讨论了复杂 SoC 和系统设计中对早期功耗分析的需求,并介绍了 VisualSim 图形建模工具作为全面的能源仿真解决方案。在第 2 部分中,我们将展示 VisualSim 在多核嵌入式环境中预测和表达多个场景(偏移并发任务;比较 1 GHz 的单核与 250 MHz 的四个核;动态电压频率缩放 (DVFS)和功率门控)的功率值时的性能。

对新状态的更改可以是开始新的执行、在一段时间不活动后进入深度睡眠、执行低优先级与高优先级用例,以及内存激活和刷新等特定条件。功率表达式值必须与时钟速度和温度等时序属性同步变化。

系统级功耗探索可以评估各种功耗降低和低功耗技术的优点和节省的能源。在这里,我们将讨论这些技术,并使用 VisualSim 中的模拟模型解释它们的影响。出于本研究的目的,我们使用四核处理器、调度程序代替 RTOS、四个并发线程以及按顺序触发处理资源上的线程的中断。我们已经针对内核上的可变时钟速度、1 到 4 之间的可变内核数以及线程触发之间的偏移对模型进行了参数化。此外,我们还集成了电压和时钟速度动态变化的逻辑。

与此描述相关的框图如图 2 所示。

poYBAGN7OiKAMJq_AALMf8ARd1g900.png

图2.多核架构和四个并发线程的系统级框图

进行以下实验,我们查看每个场景的延迟和功耗。

偏移并发任务:有四个任务,默认情况下,这些任务是同时触发的。在这个实验中,我们将每个任务移动了 3.5 毫秒。这样,任务就不会同时启动。如图3所示,这种方法降低了功耗尖峰。最大尖峰从 1.0mW 到 7.5mW,节省 25%。从图 4 可以看出,延迟确实从 7ms 降低到 0.5ms,这是一个显著的改进。从图 3 和表 1 中得出的有趣推论是,所有四个内核都不再被利用,并且处理资源的任务请求中只有偶尔的重叠。对平均功耗没有影响。

比较运行在 1 GHz 的单核和运行在 250 MHz 的四个内核:在这个实验中,我们将所有任务都定位在一个以 1GHz 速度运行的单个内核上。我们使用线程的偏移量。图3的结果显示,瞬时功率和平均功率均显著降低。从图 4 中我们可以看到延迟图没有显著影响。可以看到,峰值功率与1.0mW的非失调值相同,但平均功率减少了一半,为0.15mW。这是因为处理速度存在相当大的浪费。

图3.LHS 显示随时间推移的平均功率/RHS 显示随时间变化的即时功率

pYYBAGN7OlWABYMvAAGqLYV_wsc939.png

图4.一段时间内的延迟

poYBAGN7OkOAK9aHAADORAB6G3Y622.png

表 1.上述实验的累积和平均功效

任务中具有偏移的一个内核的累积和平均功耗小于有偏移和不带偏移的 4 个内核。

动态电压频率调节 (DVFS):这是节省功率的首选技术,通过根据任务要求改变时钟速度来完成。一个很好的例子是 x86 处理器,其额定频率为 3.2GHz,但在笔记本电脑上以 1.8 GHz 运行。使用原型板,当电压频繁调整时,很难预测任务的延迟。在相关模型中,我们没有实现特定的算法,并且能够看到功率和延迟在很宽的时钟速度范围内的变化。结果如图 5 所示。我们将使用四个内核和四个偏移线程进行此运行。请注意,由于时钟速度的变化,功率和延迟会波动。延迟与原始偏移版本相同。DVFS帮助我们大规模降低功耗。

从图 4 中我们可以看到,所有任务的时隙都不相同,随着传入任务的增加,时钟速度会根据需求随每个内核而变化。

图 6:通过实施电源管理降低平均功耗

强制内核在特定时间段后进入待机状态将降低功耗。从图 6 中,我们可以直观地看到,实施电源管理后功耗会降低。为了扩展DVFS示例,可以修改每个任务的开始和频率。在分析生成的统计信息时,我们可以看到正在使用的内核数量减少(core_3),从而消除了额外的待机功率并减少了功耗。如您所见,同时探索电源选项和软件调度非常重要。这将确保所需的响应时间,同时减少功耗。

功率门控:这是在一段时间不活动后将处理单元移动到较低功率状态的过程。一个常见的例子是笔记本电脑从活动到待机再到睡眠和休眠。在此模型中,我们将功率门控状态机逻辑添加到电源表中。我们将空闲延迟设置为 10us,将转换时间设置为 1 us。设备在待机状态下停留的时间较短。从图 6 中,我们可以看到,只要内核处于非活动状态,内核的状态就会从待机变为空闲。转换时间对延迟的影响最小到零。

poYBAGN7OnSAEs5HAAJNqZ7A3o4659.png

图 6:电源门控,当内核处于非活动状态 0.1ms 时,内核从待机状态移动到空闲状态,转换时间为 1.0us

结论

系统级仿真可用于半导体级和系统级的广泛功率分析。将功率探索与性能研究结合使用可确保权衡同时进行,从而确保更高质量的产品。许多功耗研究可以在产品实施之前在系统级完成,并消除集成过程中的所有意外。

这项研究的一个附带好处是,热和机械工程师可以获得经过充分验证的数据,而不是近似的最佳判断信息。VisualSim 等软件工具将性能和功耗分析集成到单个系统级模型中,有助于更快地构建模型,使用较小的模型集减少模型维护,并在设计周期的早期进行更高质量的探索。此外,这些系统级工具在设计中比以前更早地推动探索:

每个任务中偏移的含义可降低功耗和延迟

减少内核数量并提高处理器速度可显著降低功耗

根据任务要求改变内核的时钟速度是降低系统功耗的最佳方法

使内核在非活动期间空闲,减少系统中的电源浪费

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式
    +关注

    关注

    5058

    文章

    18971

    浏览量

    301889
  • soc
    soc
    +关注

    关注

    38

    文章

    4092

    浏览量

    217748
  • RTOS
    +关注

    关注

    21

    文章

    809

    浏览量

    119357
收藏 人收藏

    评论

    相关推荐

    什么是嵌入式?一文读懂嵌入式主板

    的个人电脑不同,嵌入式系统不是为了通用的计算任务设计,而是专注于特定的应用场景,确保其特定环境运行得既高效又可靠。
    的头像 发表于 10-16 10:14 362次阅读

    【「嵌入式Hypervisor:架构、原理与应用」阅读体验】+ Hypervisor应用场景调研

    继续研读《嵌入式Hypervisor:架构、原理与应用》,想搞清楚Hypervisor的具体应用场景,是否能用于我们的嵌入式产品设计。 通过阅读“Hypervisor类型和产品”一节,知道了
    发表于 10-14 11:21

    【「嵌入式Hypervisor:架构、原理与应用」阅读体验】+第7-8章学习心得

    这是一本很好的学习嵌入式的书籍。 深入学习《嵌入式Hypervisor:架构、原理与应用》的第7-8章后,我对嵌入式Hypervisor的架构、原理及其
    发表于 10-09 18:50

    目前深圳嵌入式单片机就业环境如何?

    深圳作为中国的科技创新中心之一,嵌入式单片机领域的就业环境相对较好,以下是对该就业环境的详细分析:
    的头像 发表于 10-09 11:51 385次阅读
    目前深圳<b class='flag-5'>嵌入式</b>单片机就业<b class='flag-5'>环境</b>如何?

    嵌入式Hypervisor:架构、原理与应用 阅读体验 +Hypervisor基础概念

    解决嵌入式系统资源有限但应用场景日益复杂的难题。单核处理器计算性能的提高和多核处理器的引入为嵌入式Hypervisor的发展提供了硬件基础。与此同时,处理器芯片供应商对CPU虚拟化扩展
    的头像 发表于 10-08 15:08 337次阅读
    <b class='flag-5'>嵌入式</b>Hypervisor:架构、原理与应用 阅读体验 +Hypervisor基础概念

    嵌入式系统的未来趋势有哪些?

    ,会更多地使用环保材料,以减少对环境的污染。同时,系统设计将更加注重生态可持续性,满足可持续发展的需求。 6. 实时操作系统(RTOS)的发展 实时操作系统嵌入式系统中发挥关键作用。未来的RTOS可能会具备更好的
    发表于 09-12 15:42

    机器视觉嵌入式的应用

    对物体或场景的识别、测量和分析的技术。随着计算机技术、图像处理技术和人工智能技术的快速发展,机器视觉技术各个领域得到了广泛应用,特别是嵌入式系统
    的头像 发表于 07-16 10:30 423次阅读

    嵌入式系统怎么学?

    、C++或者Python。这些语言嵌入式系统开发中都被广泛应用。 3、微处理器/微控制器架构:学习常见的微处理器和微控制器架构,如ARM、AVR、PIC等,了解其特性和应用场景。 4、
    发表于 07-02 10:10

    一文解析嵌入式多核异构方案,东胜物联RK3588多核异构核心板系列一览

    嵌入式人工智能快速发展,对于高性能计算需求越来越大。为了解决性能与功耗的平衡、通过并行化加速计算等,越来越多地嵌入式处理器使用同构多核、异构多核和协处理器的设计。同时面对日益复杂的外部
    的头像 发表于 06-17 15:45 1773次阅读
    一文解析<b class='flag-5'>嵌入式</b><b class='flag-5'>多核</b>异构方案,东胜物联RK3588<b class='flag-5'>多核</b>异构核心板系列一览

    嵌入式多核系统崛起,IAR将复杂化为简易的利器

    随着智能科技飞速发展及广泛应用,高性能嵌入式系统已深度融入各领域,如消费电子、智能家居、医疗以及工业控制等,无数嵌入式设备悄然改变着我们的日常生活与工作。然而,单核系统性能提升上遭遇瓶颈,难以满足
    的头像 发表于 06-06 16:22 691次阅读

    嵌入式多核心系统渐成趋势,IAR工具化繁为简

    ,边缘智能又要求嵌入式系统进行架构创新,以满足其对性能、功耗、实时性及成本等多方面的需求。在此背景下,多核系统应运而生,成为了嵌入式系统发展的新方向。
    的头像 发表于 06-05 16:57 630次阅读

    PLC与嵌入式的区别是什么

    工业自动化和嵌入式系统领域,PLC(Programmable Logic Controller,可编程逻辑控制器)和嵌入式系统是两个常被提及的概念。它们各自具有独特的特点和应用场景
    的头像 发表于 05-28 16:22 5075次阅读

    嵌入式工控机主板应用场景

    嵌入式工控机主板多个领域中有着广泛的应用,其特点包括体积小、集成度高、功耗低以及控制功能强等。以下是嵌入式工控机主板的一些主要应用领域:
    的头像 发表于 04-25 17:06 1070次阅读

    嵌入式工控机性能特点 嵌入式工控机应用场景

    嵌入式工控机性能特点 嵌入式工控机应用场景 嵌入式工控机是一种专门设计用于工业控制系统的计算机设备。它具有与传统计算机不同的性能特点,并且
    的头像 发表于 02-04 11:35 593次阅读

    到底要不要放弃嵌入式这条路?

    、工业自动化等领域发展,嵌入式技术无疑是非常重要的技能。 市场需求决定人才引进 市场需求相对于其他方面来说,是一个非常关键的影响因素。嵌入式技术目前仍有广泛的应用场景和需求,而且这个领域一直
    发表于 12-07 10:43