实现异构多核十倍嵌入式内存性能的三种方法-电子发烧友网

从理论上讲，异构多核设备可以配备针对给定用例可以抛出的任何类型的操作而优化的计算块。用于视频处理的 GPU、用于对象识别的神经网络处理器、运行操作系统的 CPU 等。与同一级别的同类处理器相比，不同的适合用途的内核为 SoC 提供了更大的灵活性，因此在更广泛的工作负载范围内具有更高的性能和更低的功耗。

但是，当您开始考虑基于边缘的AI，计算机视觉等应用程序的要求时，事实是I / O和内存变得与原始处理性能一样严格，如果不是更多的话。

“内存速度只会上升得这么快，对吧？”，英伟达副总裁兼嵌入式与边缘计算总经理Deepu Talla说。“它没有呈指数级增长。由于大小的原因，位宽大致相同：它是16位，32位，64位，128位，等等。大多数嵌入式处理器通常具有32位甚至16位接口，这也是由于成本和尺寸的原因。

“记忆的速度每一代只增长2倍，这通常每三年发生一次，”他继续说道。“但是，SoC中的计算要求可能增加了10倍或20倍。

您如何协调计算性能的不成比例的提高与内存技术相对较小的进步？特别是随着处理器演变成独特的逻辑集合，这些逻辑集合都需要自己访问内存等资源。

根据塔拉的说法，你把它给他们。以下是嵌入式存储器架构为满足下一代异构多核处理器的需求而不断发展的三种方式。

#1.特定于内核的静态存储器

“如果你看看很多这样的嵌入式处理器，它们过去一直都有SRAM，”Talla说。“现在，对于每个特定的单元，我们有本地SRAM，它从DRAM获取数据，将其存储在本地并进行处理，然后发回最终输出。

特定于内核的SRAM具有一些优势，首先是无需将临时数据写回片外DRAM所带来的内存性能提升。

这种架构还具有降低功耗的额外好处，因为极低电压的SRAM模块位于SoC中相应的逻辑IP附近或附近。

“如果你去DRAM，那可能是一个数量级的功率，所以你实际上通过使用这些技术来节省功率，”Talla解释说。

#2.增加系统内存

如今，嵌入式处理器具有多达 4 MB 至 8 MB 的系统内存。此系统内存不专用于任何一个特定内核，并且可以在 CPU、GPU 和加速器等元素之间共享。