卫星中的高性能计算需要在以前是抗辐射铸造厂生产的零件领域的环境中使用先进的商用现货 (COTS) 技术。这种环境的挑战要求仔细实施硬件和软件技术,以生产具有作战人员所需的先进能力和操作可靠性的空间资产。
太空是一个很难做生意的地方。虽然被困在范艾伦带中的带电粒子可以为地球上的观察者产生耀眼的极光效果,但由于自然辐射环境引起的退化可能是决定商业和军事任务所用设备使用寿命的关键因素。不幸的是,在太空恶劣的辐射环境中,对稳健技术的需求往往与对性能的需求相冲突。新技术可以为巨大的成功和巨大的失败提供机会。如果设备中的新功能没有得到很好的理解,或者设计工具的自动功能使粗心的人陷入困境,那么最后一点尤其正确。
一般来说,辐射效应可分为两大类。由总电离剂量(TID)引起的磨损在任务过程中逐渐发生,因为零件反复遇到使半导体材料电离的粒子。在存储器和微处理器等更复杂的集成电路中,当传播延迟增加、驱动强度降低或数字设备无法切换状态导致器件无法工作时,晶体管级的变化会变成功能故障。当单个高度电离的粒子与半导体相互作用时,就会发生单事件效应(SEE)。由此产生的电荷重组可以持续几纳秒到几微秒,其影响从小的良性瞬变到设备的灾难性故障不等。
在地球同步轨道上,SEE通常由银河宇宙射线引发,这些宇宙射线已经传播了几光年,导致您的零件出现问题。在地球磁场内,SEE主要是由质子引起的,质子与构成半导体的硅发生核反应,产生离开破坏性电离轨道的子产物。
通常,通过使用抗辐射(RH)部件可以减轻辐射效应问题。然而,商用半导体行业的快速发展使得RH器件难以跟上商用现货(COTS)部件中更高的存储器密度和更高的加工性能。在许多情况下,没有相对湿度等效物可用。对于要使用的这些COTS部件,必须考虑一定程度的辐射缓解,考虑到部件,环境和防护将如何相互作用。
高性能计算 = 高容量任务
各种技术以及 COTS 和 RH 器件的混合可以实现可靠的计算性能(图 1)。单板计算机 (SBC) 的核心是三个以三模式冗余架构 (TMR) 排列的 Power PC 处理器。检测硬件在每个时钟周期比较所有三个处理器的每个输出。定期重新同步(清理)通过清除所有三个处理器的内容来清除潜在错误。如果发生错误,将禁用令人不安的处理器,直到可以对其进行清理。但是,系统继续正常运行,因为投票输出继续有效。通过改变洗涤速率,可以根据任务要求定制系统扰动率。
图1:SCS750 中使用的缓解技术摘要。
易失性和非易失性存储器都是受纠错码保护的商业设备。SDRAM使用配置为64个数据位和32个校验位的Reed-Solomon;此配置可检测并更正任何双设备故障。EEPROM历来表现出对SEU的抗扰度,因此EEPROM可以在不太稳健的ECC下运行,并通过单位纠错来实现。另一方面,EEPROM具有较低的TID容差,并使用DDC的RadPak技术进行封装,以屏蔽芯片并减少封装内的剂量。
少数抗辐射部件用于选定的功能,其中从商业部件开发解决方案的成本太困难或昂贵而不实用。这些功能包括 1553 接口和现场可编程门阵列 (FPGA)。由于其灵活性,FPGA为开发抗辐射计算解决方案提供了一条快速途径。在SCS750的情况下,FPGA中的触发器受TMR保护,用于支持处理器的投票电路和存储器(SDRAM和闪存)的纠错。
闪存革命
闪存无处不在:手机、汽车、工业机器人等等。将闪存带入太空任务的原因相当明显。随着大批量生产,生产高度可靠零件的庞大工业基地也随之而来。闪存 NAND 具有极高的密度(高达数百 Gb),作为任务推动者很有吸引力。
但是,附加功能并非没有一些额外的怪癖。与SRAM等旧技术不同,NAND设备在正常工作条件下会自然产生坏位。即使在陆地环境中,也需要ECC来实现良好的耐久性和保持特性。在地球上,由于存储单元中的电荷泄漏而发生单个损坏的位;然而,在太空中,翻转机制更加多样化。需要考虑多位翻转和功能中断。不过,与往常一样,解决方案可以根据任务量身定制。在较温和的轨道上,诸如BCH代码之类的稳健ECC可以处理错误率,而在更恶劣的环境中,ECC错误代码可能需要与TMR架构(或冗余副本)结合使用以处理功能中断。
与许多COTS部件一样,闪存在远低于许多任务所需剂量的剂量下容易受到TID降解的影响。对于多级单元(MLC)设备,这些影响通常更差,其中多个位存储在单个数据单元中,并且对阈值偏移的容差要小得多。因此,空间设计师倾向于单层单元(SLC)设备,这些设备的操作余量要大得多。TID 容差可能因特征尺寸而异。在许多情况下,可以通过在器件封装中添加额外的屏蔽来减轻总剂量效应。
新的前沿
虽然军用电子不再在创新方面引领市场,但不同的技术使得在需要高可靠性的系统中使用商业部件成为可能。这一新现实的一个意想不到的后果是近年来资格认证流程的变化。过去,所有进入太空的部件都应该是防弹的;相比之下,现在设计师已经掌握了使用商业零件的挑战。他们通过使用大量冗余的设计或安装低成本、短期任务来弥补这种转变。这种严重冗余方法的一个突出例子来自SpaceX,其龙补给船可能会失去发动机,但仍成功完成其任务。此外,低成本/短持续时间类别的典型代表是立方体卫星的出现。在这两种情况下,新方法都为低成本,高性能的任务打开了大门,这些任务有望在未来几年内带来令人兴奋的新功能和发现。
审核编辑:郭婷
-
处理器
+关注
关注
68文章
19184浏览量
229230 -
存储器
+关注
关注
38文章
7458浏览量
163636 -
计算机
+关注
关注
19文章
7436浏览量
87754
发布评论请先 登录
相关推荐
评论