0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

XiP适合边缘物联网和人工智能的代码和性能要求

星星科技指导员 来源:嵌入式计算设计 作者:Gideon Intrater 2022-11-30 14:38 次阅读

传统的微控制器MCU) 架构(具有处理器、片上闪存和外设输入或输出设备)40 多年来基本保持不变。然而,新兴的应用和用例正在颠覆这一长期建立的设计范式,不断变化的系统要求要求:

大量代码和/或

大量的加工和性能

例如,考虑小型连接设备的激增,例如物联网端点或运行高级蜂窝或无线协议(如LTE-M,NB-IoTWi-Fi)的可穿戴设备。这些通信堆栈包含大量代码,由于应用软件的庞大尺寸,通常不适合MCU的嵌入式闪存。

或者考虑人工智能AI) 和推理应用程序的快速增长,这些应用程序需要在网络边缘具有大量的数据处理性能,这反过来又会导致高水平的功耗。为了满足这些对更高性能和更高功率效率的双重竞争要求,设计人员可以在更现代的工艺技术(如 22nm 甚至更精细的几何形状)上构建设计。但是,这些较新的工艺节点不提供片上闪存。

这些用例给边缘设备设计人员带来了挑战:如何设计一种架构,提供所需的性能和内存空间来执行大量代码,同时遵守极低的功耗和更小的芯片尺寸的限制。

内存扩展架构

答案是将部分或全部MCU闪存放置在片外,以就地执行或XiP模式运行。XiP 是一种直接从外部闪存执行代码的方法,而不是先将其从闪存复制到 RAM,然后从该 RAM 执行程序。由于XiP架构中的闪存位于芯片外部,因此设计人员不受芯片上存储器数量的限制 - 外部存储器可以根据需要大,以高效处理非常大的代码集。

这种新型MCU架构的一个主要例子是恩智浦的RT系列“交叉处理器”,例如 i.MX RT1050。设计灵活性是这些器件的主要优势之一,因为它们不包括内部闪存,而是使用外部存储器,这使得这些MCU能够适应应用所需的任何大小的代码和数据存储器空间。此外,通过从芯片中移除嵌入式闪存,恩智浦能够在芯片上放置其他功能,以帮助优化以提高性能或能效。

将闪存放置在片外还可以在更先进的工艺节点(低于 40nm)中制造处理器,以支持更高的处理速度、更高的能效和更低的成本。嵌入闪存具有挑战性,尤其是在现代工艺技术中,嵌入闪存所需的额外制造步骤会显著增加硅的成本。采用片上闪存设计的MCU必须吸收工艺成本(比不带闪存的相同工艺版本贵约30%至40%),以及闪存本身的面积成本。

然而,要打造成功的XiP架构,设计人员不能只使用任何闪存。串行闪存通常用于应用程序存储,例如PC中的BIOS。为此,闪存模块的性能或电源效率并不是特别重要,因为它仅在启动时用于将闪存的内容复制到RAM。但是,当闪存在 XiP 架构中使用时,软件会按需从外部存储器中获取,这意味着高性能和电源效率变得至关重要。

Adesto设计了一种闪存器件,该器件经过专门优化,可用作XiP微架构的外部存储器。Adesto EcoXiP Octal xSPI 非易失性存储器 (NVM) 利用串行闪存技术的进步来满足高性能要求,使闪存设备能够通过随机访问来响应来自恩智浦 RT1050 等设备的读取请求,并以低延迟和高吞吐量提供指令和数据。

闪存挑战1:性能瓶颈

在XiP架构中构建外部闪存系统以用作随机存取存储器存在许多挑战。首先,处理器和外部闪存是独立的设备,通过串行总线接口连接。在传统的串行接口中,数据通过一条线路串行传输。这会带来性能瓶颈和数据流延迟,尤其是在具有高性能要求的系统中。

Adesto 设计的 EcoXiP 能够快速响应来自主机 MCU 的读取请求,并以低延迟和高吞吐量提供指令和数据。事实上,EcoXiP 器件符合 JEDEC 最新的八通道 SPI 协议 (xSPI),使通信速度比单线串行闪存快得多。EcoXiP 提供多线智能串行外设接口,以加快 CPU 和外部闪存之间的数据流,允许数据一次通过八条并行数据线传输。

此外,EcoXiP 还具有双倍数据速率 (DDR),这是高速 DRAM 中常见的功能。DDR 的工作原理是在串行时钟的上升沿和下降沿上发送数据位。现代串行闪存设备的时钟速度大于 100MHz,并且由于发送数据位只需要半个时钟周期,DDR 有可能使外部存储器的吞吐量翻倍。将八通道接口与 DDR 功能相结合,可将 xSPI 协议在单线串行闪存上的吞吐量提高 16 倍。

EcoXiP 还通过减少命令接口的开销来解决延迟问题。“带换行的突发读取”命令的“连续”模式通过减少后续数据读取所需的时钟周期数,可以更快地访问数据。使用此命令消除了发送命令和地址的需要,然后在连续缓存未命中等待阵列访问时间(虚拟周期)。这样可以在此类访问中节省大约 20 个周期,从而减少 CPU 看到的平均延迟。

poYBAGOG-nSAI_XSAABIjtFX_bY538.png

图2 八进制相对于四进制的性能优势随着失效率的提高(失误率)的增加而增加

闪存挑战2:电源效率

构建具有独立CPU和外部闪存的XiP系统的另一个挑战是,除了互连所需的能量外,为这两个独立设备供电可能会增加系统的总能耗。EcoXiP 的设计通过在 XiP 模式下提供有竞争力的功耗来降低这种风险。对于 133MHz 八通道 SPI 读取,EcoXiP 读取电流通常为 35mA,约为类似八通道 SPI 器件速率的一半。此外,EcoXiP 还提供可配置强度的 I/O 驱动程序。优化驱动程序的强度可最大程度地降低 CPU 和 EcoXiP 之间通信所需的功耗。

pYYBAGOG-nuAUROFAABjrp83RJ4896.png

图3 EcoXiP相对于竞争对手八通道器件的功耗优势 – 通过恩智浦 i.MX RT1050的CoreMark测试显示,该测试具有指令缓存失效功能,可模拟任务切换和中断处理

此外,EcoXiP 在 CPU 不需要闪存时提供深度省电和超深度掉电模式。在超深省电模式下,该器件通常消耗 200 纳安电流,功耗极低,对唤醒时间的影响很小。

超深省电模式提供了XiP相对于基于RAM的系统的另一个优势。在该模式下,闪存的功耗明显低于片上SRAM或外部DRAM。一些基于 RAM 的系统设计人员会选择在深度睡眠时关闭内存电源,但这需要从外部闪存重新加载 RAM,这是一项耗时且耗电的操作。

闪存挑战3:无线更新

XiP系统设计人员面临的另一个挑战是提供一种对外部闪存上的程序信息执行无线(OTA)更新的方法。使用 OTA 更新写入闪存可能会在较长时间内阻止闪存响应读取,从而阻止系统更新所需的下一条指令,从而导致处理死锁。

EcoXiP 的并发读写(也称为随写而读或 RWW)允许主机处理器继续从闪存阵列的分区读取,同时修改另一部分的数据。例如,涉及对串行闪存的擦除和编程操作的定期数据记录不会使XiP程序处于暂停状态。借助 RWW 功能,编程期间的指令和数据获取在闪存的不同分区中照常进行。

Adesto与微电子行业开放标准和出版物的全球领导者JEDEC密切合作,为MCU如何与XiP架构中的串行闪存设备通信建立标准。Adesto 是第一家实施所有串行闪存 JEDEC 标准(包括 JESD216D、JESD251 和 JESD252)的闪存制造商,因此遵守这些标准的设计人员可以可靠地实施 EcoXiP,以构建针对 XiP 架构优化的高级设备。

结论

虽然片外闪存不是芯片设计人员面临的所有挑战的答案,甚至不是每个系统或应用的答案,但XiP架构能够支持可扩展的外部软件和数据存储器空间,以满足新兴用例,特别是边缘物联网和人工智能应用。将外部串行闪存与嵌入式处理器结合使用,可提供高度可扩展的平台,以应对当今不断发展的嵌入式系统的许多挑战。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19349

    浏览量

    230286
  • 物联网
    +关注

    关注

    2910

    文章

    44778

    浏览量

    374675
  • 人工智能
    +关注

    关注

    1792

    文章

    47442

    浏览量

    238993
收藏 人收藏

    评论

    相关推荐

    联网就业有哪些高薪岗位?

    进行分析和挖掘,提供有价值的信息和见解,以支持决策和业务发展。对于数据科学和人工智能有深入了解的数据分析专家,将迎来更多的高薪岗位机会。 联网产品经理: 负责对
    发表于 01-10 16:47

    哪些专业适合学习嵌入式开发?

    市场的80%以上,那什么专业能够轻松转行呢? 1)计算机科学与技术:作为基础学科,计算机科学与技术专业提供了编程、算法、数据结构等基础知识,适合转行到嵌入式、人工智能联网领域。 2
    发表于 01-03 13:44

    嵌入式和人工智能究竟是什么关系?

    人工智能应用的实时响应。与此同时,嵌入式系统在边缘计算和联网领域,也为人工智能的应用提供了广阔的空间。 在
    发表于 11-14 16:39

    《AI for Science:人工智能驱动科学创新》第6章人AI与能源科学读后感

    幸得一好书,特此来分享。感谢平台,感谢作者。受益匪浅。 在阅读《AI for Science:人工智能驱动科学创新》的第6章后,我深刻感受到人工智能在能源科学领域中的巨大潜力和广泛应用。这一章详细
    发表于 10-14 09:27

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    的发展机遇。同时,这也要求科研人员、政策制定者和社会各界共同努力,构建一个健康、包容的AI科研生态系统。 总之,《AI for Science:人工智能驱动科学创新》的第一章为我打开了一个全新的视角,让我
    发表于 10-14 09:12

    risc-v在人工智能图像处理应用前景分析

    满足人工智能图像处理中对于高性能、低功耗和特定功能的需求。 低功耗 : 在人工智能图像处理中,低功耗是一个重要的考量因素。RISC-V架构的设计使其在处理任务时能够保持较低的功耗水平,这对于需要
    发表于 09-28 11:00

    人工智能ai4s试读申请

    目前人工智能在绘画对话等大模型领域应用广阔,ai4s也是方兴未艾。但是如何有效利用ai4s工具助力科研是个需要研究的课题,本书对ai4s基本原理和原则,方法进行描诉,有利于总结经验,拟按照要求准备相关体会材料。看能否有助于入门和提高ss
    发表于 09-09 15:36

    名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新

    每个交叉领域,本书通过案例进行了详尽的介绍,梳理了产业地图,并给出了相关政策启示。 《AI for Science:人工智能驱动科学创新》适合所有关注人工智能技术和产业发展的读者阅读,特别适合
    发表于 09-09 13:54

    全球Works With开发者大会主题演讲方向公布!人工智能联网的变革性融合是主要焦点

    揭示联网与AI人工智能的变革性融合
    的头像 发表于 08-19 17:04 364次阅读

    RISC-V适合什么样的应用场景

    设计的理想工具,有助于培养更多的计算机专业人才。 综上所述,RISC-V适合的应用场景非常广泛,包括联网、嵌入式系统、人工智能、自动驾驶、汽车电子、数据中心和云计算以及教育和研究等多
    发表于 07-29 17:16

    FPGA在人工智能中的应用有哪些?

    FPGA(现场可编程门阵列)在人工智能领域的应用非常广泛,主要体现在以下几个方面: 一、深度学习加速 训练和推理过程加速:FPGA可以用来加速深度学习的训练和推理过程。由于其高并行性和低延迟特性
    发表于 07-29 17:05

    5G智能联网课程之Aidlux下人工智能开发(SC171开发套件V2)

    5G智能联网课程之Aidlux下人工智能开发(SC171开发套件V2) 课程类别 课程名称 视频课程时长 视频课程链接 课件链接 人工智能
    发表于 05-10 16:46

    5G智能联网课程之Aidlux下人工智能开发(SC171开发套件V1)

    机器人案例.pdf 人工智能 AI泛边缘智能安防实训 31分38秒 https://t.elecfans.com/v/25509.html *附件:泛边缘案例课.pdf
    发表于 04-01 10:40

    创龙教仪基于瑞芯微3568的ARM Cortex A-55教学实验箱 适用于人工智能 传感器 联网等领域

    界面。 适用于嵌入式系统、联网、无线传感器、人工智能等教学领域。 实验板硬件参数 配套模块 软件资源
    发表于 03-22 14:29

    嵌入式人工智能的就业方向有哪些?

    联网ARM开发 NB-IoT开发及实战 七:python工程师,人工智能工程师 python语法基础 python核心编程 基于OpenCV的机器视觉开发 嵌入式人工智能渗入生活的方方面面,广泛应用
    发表于 02-26 10:17