尽管我们试图避免或阻止它,失败确实会发生。重要的是要为失败做好准备,这样我们才能快速解决或解决它。但并非所有的失败都是一样的。例如,您每天使用的笔记本电脑可能会不时出现故障。如果它设计得很好,您可以简单地重置机器以使其恢复到原始状态。但是,正如 Maxim Integrated 微控制器专家 Carlos Rodriguez 所指出的,“我们并不总是拥有手动重置和重置我们正在设计的设备的这种奢侈。”
为了构建他的讨论,Rodriguez 概述了系统可靠性确实不可协商的四种情况:
该设备不易接近。农业或工业应用就是这种情况,其中可能有数百个传感器跨越一个领域(图 1)或制造设施内部。在这些情况下,必须对故障传感器进行物理定位并不是一种可持续的经营方式。在工业物联网环境中,如果传感器位于难以触及的位置,则可能需要停止生产线以解决问题。
保持稳健的沟通至关重要。一个例子是应急响应设备,其中错过的通信可能会导致毁灭性的后果。
连续处理至关重要。例如,心脏起搏器等医疗设备即使是片刻也不能停止工作;否则,后果可能是致命的。
存储的数据很有价值。此场景中的示例包括加密硬件钱包应用程序,如果存储私有加密密钥的内存位置损坏,则可能会阻碍对资金的访问。
可能出现问题并导致系统失败的三件主要事情是什么?Rodriguez 指出,代码中可能存在损坏,导致无法生成所需的输出。数据可能会丢失或损坏。或者,数据从 A 点传输到 B 点时出现问题。
Rodriguez 深入研究了这些系统故障的根本原因,指出了两个关键问题以及解决这些问题的方法。问题之一是我们看不到的东西:阿尔法粒子。从太空中倾泻而下的宇宙射线包含这些阿尔法粒子,它们会在电子设备的内存中触发不希望的位翻转,并导致:
系统故障
内存损坏,导致数据丢失
不可预测的设备输出
以及其他突发事件
设备中的内存越大,误码的可能性就越大,因为 alpha 粒子进入这些区域的可能性就越大。当像笔记本电脑这样的设备以这种方式受到阻碍时,您可以将其重置。但是,如果它是一个无法重置的设备,则该系统需要其内存中的纠错码 (ECC)。ECC 检测内存中位错误的确切位置并纠正这些错误。“ECC 将提高内存的稳健性,并降低系统在产品整个生命周期内出现故障的可能性,”Rodriguez 说。
黑客提出了另一个关键问题。Rodriguez 指出,众所周知,黑客可以找到多种方法来改变设备的性能。例如,通过:
在通信过程中交叉数据并用虚假信息替换它
将代码注入微控制器以改变应用程序的行为
从存储的数据中窃取信息
Rodriguez 解释说,解决方案是将具有强大安全功能的微控制器集成到您的设计中,例如:加密引擎、循环冗余码 (CRC)、安全引导加载程序、真随机数生成器 (TRNG) 和安全非易失性密钥存储。他说,这些功能使黑客更难进行任何形式的篡改。
用于高可靠性系统的微控制器
Maxim Integrated 推出了一款旨在保持系统高可靠性的新型低功耗微控制器:MAX32670,它基于带浮点单元的 100MHz Arm ® Cortex ® -M4 处理器。其嵌入式存储器包括带 ECC 的 384KB 闪存、带可选 ECC 的 160KB SRAM 和带 ECC 的 16KB 统一高速缓存。为安全起见,该器件具有安全引导 ROM、安全非易失性密钥存储、TRNG、CRC 16/32 和高级加密标准 (AES) 128/192/256。该器件具有高能效,在活动模式下的工作电流低至 44µA/MHz,在其最低功耗睡眠模式下约为 0.1µA,并采用 5mm x 5mm TQFN 封装(即将推出更小的 WLP)。
审核编辑:郭婷
-
处理器
+关注
关注
68文章
19286浏览量
229847 -
嵌入式
+关注
关注
5082文章
19126浏览量
305214 -
存储器
+关注
关注
38文章
7492浏览量
163839
发布评论请先 登录
相关推荐
评论