0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

设备故障所导致的随机硬件失效

瑞萨电子 来源:瑞萨电子 作者:克里斯托弗 2021-10-13 14:34 次阅读

汽车原始设备制造商(OEM)一直处于移动出行(Mobility)和高级驾驶辅助系统(ADAS)的前沿,在这个快速发展的领域争夺领导地位。随着这些系统的进步,车辆中半导体元件的数量也随之增加,以应对不断增加的新功能。

面对车用半导体市场如此快速的增长,瑞萨电子开发了许多车用产品,这其中包括微控制器MCU),高度集成的片上系统(SoC) 处理器,存储器以及电源管理系统(PMIC)。

然而,随着行业的发展,问题仍然存在:“我们如何才能在整个行业中标准化这些元件的开发和设计,以便我们能够应对风险并自信地声称该部件在功能上是安全的?”

因此,在ISO 26262的第一版中,汽车行业尝试了开发的标准化,以便将如下所列出的大型系统元件开发时的风险降至最低:

因某些相关关系的遗漏,或不完整的分析所导致的系统性风险

设备故障所导致的随机硬件失效

在过去大约十年的时间里,汽车OEM一直依靠该标准的第5部分(part 5)来帮助他们解决硬件故障,以实现业界公认的“安全”设计。瑞萨电子在产品开发中也采用了类似的标准,通过使用失效模式影响诊断分析(FMEDA)以及相关失效分析(DFA)对我们的产品进行分析,并提出解决设计中随机硬件失效的策略。

在该标准第5部分的基础上,为了应对汽车系统的复杂性,ISO 26262扩大了其覆盖范围,包括进了专门针对半导体元件的第11部分(part 11)。

为了满足提高功能安全的同时降低成本的这一新需求,除了我们的R-Car片上系统处理器之外,瑞萨还为汽车系统设计人员提供多轨、高功率的电源管理系统 (PMIC)。这不仅能够减少元件数量,还能够提供系统开发所需的高性能。

为帮助汽车设计师了解在购买PMIC时需要注意哪些事项,我们将对功能安全设计时所需要的分析进行说明。为了解决在元件层面和系统层面上的相关失效及随机硬件失效问题,瑞萨电子的所有电源产品均采用了类似的架构。这样下次当您发现我们的R-Car套件搭载了瑞萨的PMIC时,您就会对自己的选择充满信心。

1. ISO 26262分析方法

ISO 26262 Analysis Tools

在通读ISO 26262后,我们总结了该规格推荐的3种用于开发符合功能安全的产品的分析方法,具体如下:

框图

失效模式,影响及其诊断分析(FMEDA:Failure Modes Effects and Diagnostics Analysis)

相关失效分析(DFA:Dependent Failure Analysis)

这些方法之所以会被推荐,是因为它们能够降低复杂性的同时完成功能安全的设计。瑞萨电子为了解决随机硬件失效的问题,在设计每一款PMIC产品时都采用了这些分析方法。

向下滑动继续阅读 ↓

1.1 框图(The Block Diagram

通读ISO 26262的规格,可以明显感觉到规格制定者重视的一件事:避免不必要的复杂性。并且,该规格给出了一套制作框图的标准:

对设计进行抽象化,以确保每个区块都有专门的功能,消除不必要的(往往会引起混乱的)混合功能

使用概念安全分析(conceptual safety analysis)对运作流程简化,并对具体功能的执行位置进行最优化

图2显示了此类框图的一个简单示例。

1.2 失效分析方法 (Failure Analysis Tools)

在开始分析之前,我们需要确认规格希望我们在分析中使用的方法。这些方法可帮助我们确认安全机制和其保护对象的相关性(Dependent Failure)以及鲁棒性设计(Robust Design)所允许的故障模式。

DFA:此分析方法有助于我们对相关失效进行识别。例如,当我们想要找出安全机制和其保护对象的元件之间相关失效时,可以使用此方法

下面给出几种利用该分析方法进行识别的常见案例:

VCC:为安全机制供电的电路发生漂移、噪声或故障时,可能会对供电设备产生不利影响

温度:温度的升高或降低可能会影响监测精度的同时,降低其控制某些对象的能力

DFA通过识别并减轻相关关系(Dependencies)的方法,使这些影响得到减轻。

FMEDA:该分析方法在考虑了例如电阻串损坏和漂移等普遍被接受的故障模式的前提下,对功能所受的影响进行分析。同时还可用作失效性模拟器,对ASIL评级的安全范围是否合理的进行确认

DFA需要识别各个功能之间的相关性,而FMEDA则是一种更为直接的方法。FMEDA的目标是调查功能的层次结构并将预想的故障模式应用于每个元素。此处涵盖的故障最初在ISO 26262的第5部分中引入,然后在第二版的第 11 部分中进行了扩展。其中包括:

电阻器故障和元漂移

内存中的软错误率,以及数字逻辑电路中的固定型故障

数据传输失败

在概念设计阶段,将这些故障应用于设计,创建机制来解决故障模式,然后分配覆盖范围。

2. 瑞萨PMIC架构介绍

Introducing Renesas PMIC Architecture

瑞萨电子基于这些分析的结果,定义了产品的主要元素。

基准电压的生成:这通常包括分配带隙和偏置电压的电路

内部电源的生成:为设备的内部元件提供电源的内部电源域

开关:这包括提供输入电压切换的预驱动器和驱动器电路

PWM控制电路:这包括整个控制回路

调节器使能:启用或禁用调节器

数字核心:控制上述要素的构成使其可用于不同的应用

通常,这些系统就是PMIC(电源管理系统)的基本构成要素,如图3所示。

结合DFA和FMEDA,我们可以从概念上分析我们的架构,并考虑追加必要的功能和安全机制,以提高对硬件失效方面的鲁棒性。虽然此分析并非详尽,但它将为我们的数据资料提供一些背景信息

向下滑动继续阅读 ↓

2.1.1 内部轨和偏置生成(Internal Rail and Bias Generation)

瑞萨电子在设计产品时,首先会明确各个要素间的偏置关系。例如,为设备周围的电路提供抽头电压的DAC

我们根据DFA定义了故障模型并总结为以下内容。

共因失效 (CCF:Common Cause Failure):单个故障导致两个独立元件各自发生故障

级联失效(Cascading Failure):一个元件出现的故障导致另一个元件出现故障

将这两种失效模型与图3结合来看,偏置和VCC使用了同一个生成源,如果出现故障,将会影响电压调节和监测机制。

为了解决这个问题,原始架构被更改的更加独立。

图6给出了处理这种相关关系时的一种方法,其中有单独的偏置电路(带隙)和电压DAC来创建各自独立的偏置点。这减少了电路之间的相关性,这也是为什么您会在我们的许多数据表中找到独立的带隙、带隙监测器和VCC监测器的原因。安全要求越严格,解决方案就越复杂。

2.1.2 PWM控制电路和输出开关及驱动器(PWM Control Circuit & Output Switches and Drivers)

在设计反馈回路时,不同的架构决定了不同的性能以及必要的安全机构,因此反馈回路的设计对PMIC尤为重要。具体的失效模式分析示例如下:

由于被固定在高电平或低电平而导致输出切换的故障:这将导致由于直通短路或将输出直接连接到地或 VIN 而导致切换出现无规则性的问题

为防止负载变化期间相对于设定值出现的过度变化的控制回路补偿:这里的潜在故障是,控制器的带宽急剧变化可能导致过压或振荡现象的发生

由于许多故障会导致输出电压偏离其设定值或输出电流超过设备或其负载的安全额定值,因此PMIC需要具有监控输出电流和输出电压的安全机制。这些安全机制通常由比较器或板载模数 (A/D) 转换器来实现。

接下来,我们将用DFA来分析反馈节点。在反馈路径中,通常有一个电阻分压器网络将输出电压转换为内部参考电平。若该电阻器出现故障,目标设定值会变得不正确,并且影响监测机制的监测能力。

因此我们得出了以下标准:

设备需要设置两个独立的反馈源,以解决反馈节点与板上另一个引脚或另一个电压短路的相关故障

这种独立的反馈源需要一个冗余电阻分压器来解决电阻反馈网络任何部分的短路故障模式

出于这个原因,您经常会在我们的产品中看到除了反馈引脚之外还有另一个用于监控的引脚。如果是内置反馈电阻,则大多情况下会为了冗余性而设立其他不同的路径。

对于最后的两节中,我们的焦点将由控制回路转向监测机制。

2.1.3 监视器和控制(Monitors and Controls)

监视器和使能控制可以说是设备中最重要的电路之一,因为它们对于确保系统功能安全的安全机制的实施至关重要。它们由以下一系列比较器电路组成:

过流监测

上电复位监测

输出电压(过压和欠压)监测

内部时钟监测

在进行FMEDA分析时,我们假设比较器输出出现了固定型故障(固定在高位和低位)。在这两个故障中,固定在低位的影响更大,因为在正常操作中会漏掉发生的故障,成为潜在故障。为了提高设备检测出这些低位固定型故障的能力,瑞萨PMIC设置了自检功能 (ABIST)。

数字控制器将输入切换至比较器以生成强制触发,正常运作得到确定后,输入控制再次变为正常模式。

2.1.4 数字内核(Digital Core)

如图9所示,数字内核位于模拟部分附近,并且通常分为负责功能安全相关控制的部分和负责稳压器启动和控制的部分。

这种架构通常更适合用于减少DFA分析所发现的相关关系。为了更好地理解数字内核的结构,请参见图9,其中主要功能包括:

通常由寄存器和一次性可编程 (OTP) 熔丝构成

功能安全相关控制,通常由状态机实现

通信,通常搭载I2C 或 SPI 控制器

在这里,针对一次性可编程(OTP)熔丝阵列和配置寄存器进行数据损(Bit Corruption)相关的FMEDA分析后,能够预想到在启动或者运行时将会出现芯片配置错误的故障。为了防止出现此问题,在启动时和设备配置中定期执行循环冗余计算(CRC)。并且将此方法扩展到通信接口

实现数字部分的安全机制的方法还有很多,除了CRC之外,还有以下列出的安全机制:

必要的冗余逻辑

时钟监测

逻辑BIST(LBIST),与ABIST一样,检查数字逻辑是否存在固定型故障

3. 结论

每个新产品的开发,都会由设计团队和安全团队对功能安全机制进行探讨研究,然后由营销团队将这些新产品的特点进行推广和普及。本文中介绍的概念性分析旨在为读者提供一些捷径,以便于了解瑞萨电子是如何设计ASIL级电源管理产品,以及为何我们会在硬件数据表中列出各种“安全”相关功能的原因。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 电源
    +关注

    关注

    184

    文章

    17732

    浏览量

    250456
  • 瑞萨
    +关注

    关注

    35

    文章

    22309

    浏览量

    86376
  • adas
    +关注

    关注

    309

    文章

    2185

    浏览量

    208677

原文标题:工程师说 | 用于为ADAS应用开发的电源系统的功能安全开发工具和方法

文章出处:【微信号:瑞萨电子,微信公众号:瑞萨电子】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    端子失效的常见原因及解决办法

    端子失效的常见原因及解决办法 在现代电子设备和电路系统中,端子作为连接各个组件的关键部分,其稳定性和可靠性至关重要。然而,端子失效的情况时有发生,这不仅影响设备的正常运行,还可能
    的头像 发表于 12-29 10:47 195次阅读

    谐波会导致设备发热吗?

    谐波会导致设备发热。谐波电流在设备中会产生额外的损耗,这些损耗会转化为热量,从而导致设备温度升高。具体来说,谐波电流在电机中会产生铁心损耗、
    的头像 发表于 12-11 15:28 123次阅读

    材料失效分析方法汇总

    材料故障诊断学:失效分析技术失效分析技术,作为材料科学领域内的关键分支,致力于运用科学方法论来识别、分析并解决材料与产品在实际应用过程中出现的故障问题。该技术对于增强产品的可靠性、改进
    的头像 发表于 12-03 12:17 289次阅读
    材料<b class='flag-5'>失效</b>分析方法汇总

    什么是故障电弧?故障电弧的危害有哪些?

    ,它的产生通常由于电气线路或设备中绝缘老化破损、电气连接松动、空气潮湿、电压电流急剧升高等原因引起空气击穿导致的气体游离放电现象有关。故障电弧会
    的头像 发表于 10-22 16:48 260次阅读
    什么是<b class='flag-5'>故障</b>电弧?<b class='flag-5'>故障</b>电弧的危害有哪些?

    谷景科普色环电感失效的现象有哪些

    的现象主要包括但不限于电路故障、出现异响、发热异常等等。如果色环电感在电路中失效,将会直接影响电路运行的稳定性,可能会导致电路无法正常工作。比如,色环电感原本在电路
    发表于 09-16 23:14 0次下载

    芯片失效分析中常见的测试设备及其特点

    在芯片失效分析中,常用的测试设备种类繁多,每种设备都有其特定的功能和用途,本文列举了一些常见的测试设备及其特点。
    的头像 发表于 08-07 17:33 892次阅读
    芯片<b class='flag-5'>失效</b>分析中常见的测试<b class='flag-5'>设备</b>及其特点

    连接器发生失效故障的三大原因

    连接器作为实现设备电路互连的核心基础器件,其可靠性与稳定性直接影响着系统的运行,因此应当从多个方面尽量避免连接器发生失效故障。 一、材料质量是连接器失效的主要原因之一。当连接器使用的材
    的头像 发表于 07-30 14:01 721次阅读

    电源输入电压范围裕量太小导致设备运行故障

    电源输入电压范围裕量太小导致设备运行故障设备批量生产并销售后,在某个客户处多台设备出现故障
    的头像 发表于 07-11 08:17 1439次阅读
    电源输入电压范围裕量太小<b class='flag-5'>导致</b>的<b class='flag-5'>设备</b>运行<b class='flag-5'>故障</b>

    win连接串口会导致开发板按键失效,为什么?

    open的那一刻会导致板子reboot,可以正常看到板子的串口打印信息,板子的按键失灵,无法触发 gpio_isr_handler -> xQueue 事件。 请问是什么原因导致按键失效
    发表于 06-21 13:06

    电子元器件失效分析技术

    电测在失效分析中的作用 重现失效现象,确定失效模式,缩小故障隔离区,确定失效定位的激励条件,为进行信号寻迹法
    的头像 发表于 04-12 11:00 618次阅读
    电子元器件<b class='flag-5'>失效</b>分析技术

    是什么原因导致热敏电阻失效

    热敏电阻失效的原因包括环境温度过高或过低、工作电流过大或过小、材料老化以及机械损伤等。了解这些原因并采取相应措施,可避免热敏电阻失效,提高电子设备的稳定性和可靠性。选用品质好的热敏电阻同样重要。
    的头像 发表于 04-08 09:59 967次阅读
    是什么原因<b class='flag-5'>导致</b>热敏电阻<b class='flag-5'>失效</b>?

    是什么原因导致热敏电阻失效

    热敏电阻失效的原因包括环境温度过高或过低、工作电流过大或过小、材料老化以及机械损伤等。了解这些原因并采取相应措施,可避免热敏电阻失效,提高电子设备的稳定性和可靠性。选用品质好的热敏电阻同样重要。
    的头像 发表于 04-08 09:58 770次阅读
    是什么原因<b class='flag-5'>导致</b>热敏电阻<b class='flag-5'>失效</b>?

    小区门禁系统常见故障及解决方法

    小区门禁系统是保障小区安全的重要设备,但常常会遇到各种故障。本文将从硬件故障、软件故障及其他常见故障
    的头像 发表于 02-02 11:00 3203次阅读

    变电常见故障和排除方法

    由于各种原因,变电可能会出现各种故障,影响电力系统的正常运行。本文将对变电常见故障及其处理措施进行介绍。 1. 变压器故障 变压器是变电
    的头像 发表于 01-25 11:56 2320次阅读

    晶振失效三大原因及解决办法

    晶振失效三大原因及解决办法 晶振失效是指晶体振荡器无法正常工作,造成电子设备不能正常运行的情况。晶振在电子设备中起到非常关键的作用,它是产生时钟信号的核心元件。晶振
    的头像 发表于 01-24 15:40 2356次阅读