0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为异构多核实现十倍嵌入式内存性能的三种方法

星星科技指导员 来源:嵌入式计算设计 作者:Brandon Lewis 2022-06-02 09:35 次阅读

从理论上讲,异构多核设备可以配备一个计算块,该计算块针对给定用例的任何类型的操作进行了优化。用于视频处理的 GPU、用于对象识别的神经网络处理器、运行操作系统CPU 等等。与同级别的同质处理器相比,不同用途的内核为 SoC 提供了更大的灵活性,因此在更广泛的工作负载范围内具有更高的性能和更低的功耗。

但当您开始考虑基于边缘的 AI计算机视觉等应用程序的要求时,事实是 I/O 和内存变得与原始处理性能一样受到限制,甚至更多。

“内存速度只会这么快,对吧?” 英伟达嵌入式与边缘计算副总裁兼总经理 Deepu Talla “它并没有呈指数级增长。由于大小,位宽大致相同:它可以是 16 位、32 位、64 位、128 位,等等。大多数嵌入式处理器通常具有 32 位甚至 16 位接口,这也是出于成本和尺寸的原因。

“内存的速度只是一代比一代增长 2 倍,而且这通常每三年发生一次,”他继续说道。“然而,SoC 中的计算需求可能增加了 10 倍或 20 倍。”

您如何协调计算性能的这种不成比例的增长与内存技术的相对较小的进步?特别是当处理器演变成独特的逻辑集合时,它们都需要自己访问内存等资源。

根据塔拉的说法,你把它给了他们。以下是嵌入式存储器架构为满足下一代异构多核处理器的需求而发展的三种方式。

1、内核专用 SRAM

“如果你看很多这些嵌入式处理器,它们过去一直都有 SRAM,”Talla 说。“现在,对于每个特定单元,我们都有本地 SRAM,它从 DRAM 获取数据,在本地存储并处理它,然后发回最终输出。”

特定于内核的 SRAM 提供了几个优势,首先是由于不必将临时数据写回片外 DRAM 所带来的内存性能提升。

这种架构还具有降低功耗的额外好处,因为超低电压 SRAM 模块位于 SoC 内相应的逻辑 IP 附近或附近。

“如果你使用 DRAM,这可能是一个数量级的功率,所以你实际上是通过使用这些技术来节省功率,”Talla 解释道。

2、增加系统内存

今天的嵌入式处理器具有高达 4 MB 到 8 MB 的系统内存。此系统内存并非专用于任何特定内核,并且可以在 CPU、GPU 和加速器等元素之间共享。

与专用 SRAM 类似,更多共享系统内存的主要好处是更少的 DRAM 访问。例如,传统的视频编码序列如下所示:

DRAM -》 视频编码器 -》 DRAM -》 附加计算 -》 DRAM

增加的系统缓存可以实现这一点:

DRAM -》 视频编码器 -》 系统内存 -》 附加计算 -》 DRAM

如前所述,不同之处在于单独的内核不必不断地从片外 DRAM 中获取数据,因为大系统内存消除了对中间步骤的需要。

3、增加缓存大小

最后,随着更新的工艺技术使更高容量的内存更便宜,缓存大小将不可避免地增加。在异构 SoC 上发现的用于 CPU、GPU、DSP 和其他核心架构的更大缓存也将减少 DRAM 流量。

并且将增加的缓存大小与前两个进步配对开始产生一些重大收益。

“更多的 SRAM、通用的系统内存以及更多的大容量缓存可以让您在接下来的三到五年内将性能提高 10 倍到 100 倍,即使内存带宽可能只增加了一倍或四倍,”Talla 指出出去。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式
    +关注

    关注

    5017

    文章

    18496

    浏览量

    293167
  • DRAM
    +关注

    关注

    40

    文章

    2245

    浏览量

    182541
  • 编码器
    +关注

    关注

    42

    文章

    3458

    浏览量

    132220
收藏 人收藏

    评论

    相关推荐

    如何提升嵌入式编程能力?

    代码以提高性能,包括减少内存使用、提高处理速度等。 16. 调试技巧:掌握嵌入式系统的调试技巧,包括使用调试器、日志记录和性能分析工具。 17. 参加竞赛和挑战:参加编程竞赛或黑客马拉
    发表于 06-21 10:01

    一文解析嵌入式多核异构方案,东胜物联RK3588多核异构核心板系列一览

    嵌入式人工智能快速发展,对于高性能计算需求越来越大。为了解决性能与功耗的平衡、通过并行化加速计算等,越来越多地嵌入式处理器使用同构多核
    的头像 发表于 06-17 15:45 786次阅读
    一文解析<b class='flag-5'>嵌入式</b><b class='flag-5'>多核</b><b class='flag-5'>异构</b>方案,东胜物联RK3588<b class='flag-5'>多核</b><b class='flag-5'>异构</b>核心板系列一览

    嵌入式系统软硬件基础知识大全

    基础知识的探讨,我们希望读者能够掌握嵌入式系统的基本概念,理解其工作原理,从事嵌入式系统设计和开发工作奠定基础。 嵌入式系统是一专门
    发表于 05-09 14:12

    简谈Xilinx Zynq-7000嵌入式系统设计与实现

    今天给大侠带来简谈Xilinx Zynq-7000嵌入式系统设计与实现,话不多说,上货。 Xilinx的ZYNQ系列FPGA是二看上去对立面的思想的融合,ARM处理器的串行执行+FPGA
    发表于 05-08 16:23

    简谈Xilinx Zynq-7000嵌入式系统设计与实现

    今天给大侠带来简谈Xilinx Zynq-7000嵌入式系统设计与实现,话不多说,上货。 Xilinx的ZYNQ系列FPGA是二看上去对立面的思想的融合,ARM处理器的串行执行+FPGA
    发表于 04-10 16:00

    三菱M70 PLC增加注解的三种方法简析

    三菱M70 PLC增加注解的三种方法
    的头像 发表于 02-26 09:59 394次阅读
    三菱M70 PLC增加注解的<b class='flag-5'>三种方法</b>简析

    嵌入式系统发展前景?

    的发展前景也分广阔。 随着物联网和智能设备的快速发展,嵌入式系统将更为普遍地应用于各种设备和设施,包括家用电器、医疗设备、交通工具等。这些设备将通过嵌入式系统实现智能化、网络化,从而
    发表于 02-22 14:09

    嵌入式软件开发应该掌握哪些知识?

    嵌入式软件开发应该掌握哪些知识? 一、 什么是嵌入式软件? 嵌入式软件通常是指嵌入式系统中运行的软件,嵌入式系统是一
    发表于 02-19 11:23

    嵌入式学习步骤

    语言编写。但是,有些嵌入式系统也使用其他编程语言,例如Python或Java。 (3).了解硬件:深入了解您要控制的硬件设备的功能和特性。您需要了解嵌入式系统的处理器、内存、I/O端口、传感器和其他
    发表于 02-02 15:24

    【国产FPGA+OMAPL138开发板体验】1.嵌入式异构技术

    态度。在这里,您得到的不仅仅是产品,更是一信任和保障,简直是电子爱好者的天堂。 五、总结 广州星嵌电子科技有限公司,不仅有技术,还有情怀。他们致力于客户提供快速、稳定、可靠的嵌入式系统产品及服务
    发表于 01-29 00:12

    修复锂电池的三种方法

    电子发烧友网站提供《修复锂电池的三种方法.doc》资料免费下载
    发表于 11-15 10:40 5次下载
    修复锂电池的<b class='flag-5'>三种方法</b>

    多核异构中A核与M核通信过程

    目前域控项目有的采用S32G这类多核异构的芯片,转载一篇分析下多核异构中A核与M核通信过程的文章。
    的头像 发表于 10-31 11:09 663次阅读
    <b class='flag-5'>多核</b><b class='flag-5'>异构</b>中A核与M核通信过程

    三种方法实现串口接收不定长度的数据

    下面三种方式都亲测可用,实际使用时应采用第三种方法,更有效率。
    的头像 发表于 09-14 16:16 5787次阅读
    <b class='flag-5'>三种方法</b><b class='flag-5'>实现</b>串口接收不定长度的数据

    基于Tricore架构的RTThread多核实现

    在《基于Hightec+TC375TP的RT-Thread移植详解 》一文中,基于Tricore实现了单核RTThread的移植。最近,花了些时间完成遗留的任务:基于Tricore的多核移植。目前
    的头像 发表于 09-12 18:40 679次阅读

    pwm产生的三种方法

    pwm产生的三种方法 PWM(Pulse Width Modulation)是一种常用的控制技术,可以通过调节开关管的通断时间,通过改变输出波形的占空比来实现对电路的控制。在现代工业控制中,PWM
    的头像 发表于 09-02 10:25 6550次阅读