0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为异构多核实现十倍嵌入式内存性能的三种方法

星星科技指导员 来源:嵌入式计算设计 作者:Brandon Lewis 2022-06-02 09:35 次阅读

从理论上讲,异构多核设备可以配备一个计算块,该计算块针对给定用例的任何类型的操作进行了优化。用于视频处理的 GPU、用于对象识别的神经网络处理器、运行操作系统CPU 等等。与同级别的同质处理器相比,不同用途的内核为 SoC 提供了更大的灵活性,因此在更广泛的工作负载范围内具有更高的性能和更低的功耗。

但当您开始考虑基于边缘的 AI计算机视觉等应用程序的要求时,事实是 I/O 和内存变得与原始处理性能一样受到限制,甚至更多。

“内存速度只会这么快,对吧?” 英伟达嵌入式与边缘计算副总裁兼总经理 Deepu Talla “它并没有呈指数级增长。由于大小,位宽大致相同:它可以是 16 位、32 位、64 位、128 位,等等。大多数嵌入式处理器通常具有 32 位甚至 16 位接口,这也是出于成本和尺寸的原因。

“内存的速度只是一代比一代增长 2 倍,而且这通常每三年发生一次,”他继续说道。“然而,SoC 中的计算需求可能增加了 10 倍或 20 倍。”

您如何协调计算性能的这种不成比例的增长与内存技术的相对较小的进步?特别是当处理器演变成独特的逻辑集合时,它们都需要自己访问内存等资源。

根据塔拉的说法,你把它给了他们。以下是嵌入式存储器架构为满足下一代异构多核处理器的需求而发展的三种方式。

1、内核专用 SRAM

“如果你看很多这些嵌入式处理器,它们过去一直都有 SRAM,”Talla 说。“现在,对于每个特定单元,我们都有本地 SRAM,它从 DRAM 获取数据,在本地存储并处理它,然后发回最终输出。”

特定于内核的 SRAM 提供了几个优势,首先是由于不必将临时数据写回片外 DRAM 所带来的内存性能提升。

这种架构还具有降低功耗的额外好处,因为超低电压 SRAM 模块位于 SoC 内相应的逻辑 IP 附近或附近。

“如果你使用 DRAM,这可能是一个数量级的功率,所以你实际上是通过使用这些技术来节省功率,”Talla 解释道。

2、增加系统内存

今天的嵌入式处理器具有高达 4 MB 到 8 MB 的系统内存。此系统内存并非专用于任何特定内核,并且可以在 CPU、GPU 和加速器等元素之间共享。

与专用 SRAM 类似,更多共享系统内存的主要好处是更少的 DRAM 访问。例如,传统的视频编码序列如下所示:

DRAM -》 视频编码器 -》 DRAM -》 附加计算 -》 DRAM

增加的系统缓存可以实现这一点:

DRAM -》 视频编码器 -》 系统内存 -》 附加计算 -》 DRAM

如前所述,不同之处在于单独的内核不必不断地从片外 DRAM 中获取数据,因为大系统内存消除了对中间步骤的需要。

3、增加缓存大小

最后,随着更新的工艺技术使更高容量的内存更便宜,缓存大小将不可避免地增加。在异构 SoC 上发现的用于 CPU、GPU、DSP 和其他核心架构的更大缓存也将减少 DRAM 流量。

并且将增加的缓存大小与前两个进步配对开始产生一些重大收益。

“更多的 SRAM、通用的系统内存以及更多的大容量缓存可以让您在接下来的三到五年内将性能提高 10 倍到 100 倍,即使内存带宽可能只增加了一倍或四倍,”Talla 指出出去。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式
    +关注

    关注

    5056

    文章

    18953

    浏览量

    301644
  • DRAM
    +关注

    关注

    40

    文章

    2297

    浏览量

    183189
  • 编码器
    +关注

    关注

    45

    文章

    3563

    浏览量

    133928
收藏 人收藏

    评论

    相关推荐

    基于全志T113-i多核异构处理器的全国产嵌入式核心板简介

    嵌入式核心板。ECK30系列核心板可广泛应用于工业控制、HMI、IoT等领域。 全志公司的T113-i处理器是由双核ARM Cortex-A7、RISC-V和HiFi4 DSP三种异构处理器所组成,能够为用户提供高效的计算能力。
    的头像 发表于 10-25 13:40 125次阅读

    七大嵌入式GUI盘点

    嵌入式图形用户界面(GUI)是一嵌入式系统设计的用户界面,它可以让用户通过图形化的方式与设备进行交互。以下是对七
    发表于 09-02 10:58

    MCUXpresso IDE下在线联合调试双核MCU工程的三种方法

    大家好,我是痞子衡,是正经搞技术的痞子。今天痞子衡给大家分享的是MCUXpresso IDE下在线联合调试i.MXRT1170双核工程的三种方法
    的头像 发表于 08-08 15:18 426次阅读
    MCUXpresso IDE下在线联合调试双核MCU工程的<b class='flag-5'>三种方法</b>

    一文解析嵌入式多核异构方案,东胜物联RK3588多核异构核心板系列一览

    嵌入式人工智能快速发展,对于高性能计算需求越来越大。为了解决性能与功耗的平衡、通过并行化加速计算等,越来越多地嵌入式处理器使用同构多核
    的头像 发表于 06-17 15:45 1743次阅读
    一文解析<b class='flag-5'>嵌入式</b><b class='flag-5'>多核</b><b class='flag-5'>异构</b>方案,东胜物联RK3588<b class='flag-5'>多核</b><b class='flag-5'>异构</b>核心板系列一览

    嵌入式多核系统崛起,IAR将复杂化为简易的利器

    应用不断增长的需求。边缘智能同样呼唤嵌入式系统进行架构性创新,以满足其对性能、功耗、实时性及成本等多方面的严苛要求。在此背景下,多核系统及产品应运而生,引领嵌入式系统发展新潮流。
    的头像 发表于 06-06 16:22 684次阅读

    嵌入式多核心系统渐成趋势,IAR工具化繁为简

    ,边缘智能又要求嵌入式系统进行架构创新,以满足其对性能、功耗、实时性及成本等多方面的需求。在此背景下,多核系统应运而生,成为了嵌入式系统发展的新方向。
    的头像 发表于 06-05 16:57 624次阅读

    简谈Xilinx Zynq-7000嵌入式系统设计与实现

    今天给大侠带来简谈Xilinx Zynq-7000嵌入式系统设计与实现,话不多说,上货。 Xilinx的ZYNQ系列FPGA是二看上去对立面的思想的融合,ARM处理器的串行执行+FPGA
    发表于 05-08 16:23

    简谈Xilinx Zynq-7000嵌入式系统设计与实现

    今天给大侠带来简谈Xilinx Zynq-7000嵌入式系统设计与实现,话不多说,上货。 Xilinx的ZYNQ系列FPGA是二看上去对立面的思想的融合,ARM处理器的串行执行+FPGA
    发表于 04-10 16:00

    嵌入式fpga是什么意思

    嵌入式FPGA是指将FPGA技术集成到嵌入式系统中的一解决方案。嵌入式系统是一特定应用而设
    的头像 发表于 03-15 14:29 1159次阅读

    菱M70 PLC增加注解的三种方法简析

    菱M70 PLC增加注解的三种方法
    的头像 发表于 02-26 09:59 1010次阅读
    <b class='flag-5'>三</b>菱M70 PLC增加注解的<b class='flag-5'>三种方法</b>简析

    嵌入式Linux开发的三种方式

    嵌入式Linux开发主要有三种方式:裸机开发、SDK开发和驱动开发。
    的头像 发表于 01-22 14:22 889次阅读

    传统激光功率衰减的三种方法

    传统激光功率衰减通常使用以下三种方法,分别为中性密度衰减片衰减法、偏振衰减法、镀膜光学镜片衰减法。
    的头像 发表于 01-20 10:42 1601次阅读
    传统激光功率衰减的<b class='flag-5'>三种方法</b>

    分布锁的三种实现方式

    分布锁的三种实现方式  分布锁是在分布系统中用于实现对共享资源进行访问控制的一
    的头像 发表于 12-28 10:01 822次阅读

    修复锂电池的三种方法

    电子发烧友网站提供《修复锂电池的三种方法.doc》资料免费下载
    发表于 11-15 10:40 5次下载
    修复锂电池的<b class='flag-5'>三种方法</b>

    如何用三种不同的方法来用按钮控制灯光

    在电子和自动化中,一个常见的任务是使用按钮来控制灯的开/关状态。这可以用不同的方式实现,取决于设备的类型和涉及的逻辑。在本文中,我们将比较使用单片机、PLC和硬件连接来实现这个任务的三种方法。我们将讨论每
    的头像 发表于 11-10 11:47 2588次阅读
    如何用<b class='flag-5'>三种</b>不同的<b class='flag-5'>方法</b>来用按钮控制灯光