一种基于因果路径的层次图卷积注意力网络-电子发烧友网

摘要

机电系统中的故障检测对其可维护性和安全性至关重要。然而，系统监测变量往往具有复杂的联系，很难表征它们的关系并提取有效的特征。本文开发了一种基于因果路径的层次图卷积注意力网络（HGCAN），以提高复杂机电系统中数据驱动故障检测模型的性能和可解释性。引入了一种混合因果发现算法来发现监测变量之间的继承因果关系。顺序连接因果变量的因果路径用作接收场，使用多尺度卷积来提取特征。基于分层注意力机制来聚合不同级别的特征，该机制考虑到不同的特征重要性来分配自适应权重。为了验证所提出方法的有效性，使用实际高速列车制动系统的数据集验证。实验结果表明，所提出的方法有很好的性能改进效果，对算法可解释性的分析表明其有助于实际决策。

引言

复杂的机电一体化系统在现代技术中普遍存在，例如移动机械臂、隧道掘进机和航空发动机。这些系统通过集成许多异构组件来实现功能，如电气、机械和液压组件。与传统系统相比，架构和功能复杂性的增加不仅使模块耦合关系复杂化，而且模糊了子系统的边界。由于功能和时空依赖性的增加，这些系统可能会对风险变得敏感。一些微小的故障可以通过故障传播和故障级联发展，引起连锁反应，危及整个系统。因此，准确及时地检测正在发生的故障至关重要，这可以有效提高系统的可维护性、安全性和可用性。

目前开发的故障检测方法可分为三类，即基于物理的、基于专业知识的和数据驱动的。大多数基于物理和专业知识的模型都是建立在对以前故障记录的经验和分析的基础上的。然而，这些模型的性能在很大程度上取决于目标系统的可靠知识，这通常是非常昂贵和耗时的。大多数最先进的数据驱动故障检测方法直接对输入特征和系统状态之间的相关性进行建模。这种建模过程模糊不清，因此可信度较低。此外，随着监测变量数量的增加，对其内部关系进行建模变得很有挑战性。

最近，因果关系被视为获得可解释变量关系的一种很有前途的方法。具体地说，揭示和研究了变量的遗传因果关系，为了解变量如何相互因果影响提供了客观而稳健的知识。然而，目前关于利用因果关系进行系统故障检测的研究非常有限。如何将因果关系有效地结合到故障检测模型中并提高其能力仍然是一个问题。

图卷积网络（GCN）因其在处理空间结构化数据方面的有效性而受到广泛研究。这些模型利用具有非欧几里得特征的数据进行表示学习。特征提取不仅考虑了变量，还考虑了它们的空间关系，这使得其在许多领域都具有最优的性能。使用GCN对空间知识进行整合推动了故障检测应用的研究。

考虑到上述问题，本文提出了一种基于因果路径的层次图卷积注意力网络（HGCAN），用于复杂机电系统的故障检测。所开发的模型包括两个主要步骤。第一步是构建因果图，对高维监测数据进行空间表征。传统的因果发现依赖于领域知识或随机控制轨迹（RCT）。但获取相关领域知识具有挑战性，且在复杂系统中进行随机对照试验是不切实际的。因此，数据驱动方法已成为一种替代选择。针对上述问题，本工作将经验约束与数据驱动的因果发现相结合，以获得更现实、更稳定的因果结构。第二步是将因果图输入到开发的HGCAN模型中。与仅关注相邻邻居的传统基于图的模型不同，所开发的模型考虑了因果图中祖先节点对其后代节点的影响。具体而言，模型在由顺序连接的节点组成的因果路径上进行运行，从而包含了有关系统的主要信息。与系统状态变量相关的因果路径作为输入。多尺度卷积最初用于提取具有不同分辨率大小的各种特征。随后，引入了一种分层注意力机制来融合来自不同卷积尺度和路径的特征。该机制为提取的特征分配自适应权重，并基于它们在上下文中各自的重要性对其进行聚合。然后将生成的结果连接到全连接层，通过网络输出系统故障检测结果。

为了验证所提出模型的有效性，对高速列车制动系统进行了实例研究。与主流的数据驱动基准测试相比，实验结果表明了该模型的优越性。此外，对所提出的HGCAN的可解释性分析也表明了其指导实际决策过程的潜力。

这项工作的主要贡献包括：

（1）提出了HGCAN模型，该模型从因果路径中提取特征，并利用层次注意力机制自适应地聚合特征；

（2）引入了将专家知识与数据相结合的混合因果发现，用于表征监测变量之间的空间关系；

（3）考虑到因果路径在图中可能数量较多，开发了特定的路径筛选规则来过滤路径信息，提高建模效率；

（4）对HST制动系统进行了实际案例研究，以评估和验证模型的性能和可解释性。

本文的其余部分组织如下。第2节说明了所提出的用于复杂机电系统故障检测的HGCAN的详细框架。第3节介绍了HST制动系统的案例研究，并与多种数据驱动模型进行了比较。最后，在第4节中得出结论和未来的研究方向。

基于因果路径的层次图卷积注意力网络

图1描述了所提出的基于因果路径的层次图卷积注意力网络（HGCAN）的框架，该网络由两个主要步骤组成，即用于表征监测变量空间结构的因果图构建和用于因果路径特征提取的层次图卷积注意力网络构建。首先，将经验约束与因果发现算法相结合，以表征高维监测数据的空间关系。然后，提取导致图中表示系统状态的节点的因果路径，用于基于不同分辨率大小的卷积的特征提取。通过基于不同的重要性分配自适应权重，将提取的特征与分层注意力机制融合。全连接层在最后阶段产生系统检测结果。所提出方法框架的细节如以下各节所示。

图1 所提出的故障检测方法的流程图

基于混合因果发现的空间结构挖掘

在机电一体化系统中的传感器通常具有多种集成方式，这给提取有效的故障特征带来了困难。本文将变量的空间结构表示为用因果发现方法构建的因果图，揭示了所考虑变量之间的因果关系。故障的潜在产生和传播可以实现可视化，有利于特征提取和模型解释。获得因果关系的传统方法要么依赖于专家知识，要么依赖于随机对照试验。然而，这些方法受到维度爆炸的影响，即难以分析复杂系统中高维变量的内部结构。为了获得更真实的因果关系，本文引入了Peter-Clark（PC）算法与经验约束相结合的混合因果发现。目前，关于在PC算法中添加经验约束的研究有限，大多数使用该方法通过限制直接因果关系来约束搜索空间。在本文中，不仅考虑了局部关系，而且考虑了全局关系，用更全面的类型改进了经验约束。本工作中增加的经验约束包括以下两种类型：

（1）局部因果关系约束。若变量和变量之间存在（不存在）直接因果关系，则因果图中节点和节点之间存在边（无边）；

（2）全局方向约束。变量是变量的祖先原因，则因果路径只能在图中从到。此处，因果关系包括直接因果路径和间接因果路径。

约束可以通过结合PC算法中的以下步骤来实现：

（1）边缘修改。在因果骨架中，添加或删除与局部因果约束对应的边；

（2）方向控制。当将骨架扩展到因果图时，添加以下识别骨架中因果方向的规则：如果存在，则将修改为，其中是有向边，表示因果关系的直接因果影响；是一个无向边，意味着存在因果关系，但“因”没有用可用数据确定；表示任意变量集。如果和在骨架中相邻，则设定。

其他规则与PC算法中的规则相同。

（3）结构验证。因果图生成后，验证最终图中是否满足所有方向约束。如果不满足方向约束，则添加最相关的边，或调整PC算法中的参数以进行新的搜索。

通过上述过程，可以获得用因果关系表示的完全部分有向无环图（CPDAG）。图2展示了一个典型的CPDAG示例。

图2 因果CPDAG示例

基于因果路径的层次卷积注意力

在复杂系统的图中可以有许多因果路径。某些不包括目标变量的路径可能不会导致系统的故障。即只有通向表示系统状态的节点的路径才被考虑用于建模。以下步骤描述了详细的过程，其流程图如图3所示。图4描述了所提出的HGCAN的详细结构。

图3 基于因果路径的层次卷积注意力的流程图

图4 所提出的HGCAN的详细结构

（1）因果路径集构造。首先提取从一个没有祖先节点的根节点到表示系统状态的节点的父节点的因果路径（注意，不包括在路径中）。将表示为图的第个因果路径，其中是中第个节点的特征值，是的节点数。

（2）路径多尺度卷积。为了从因果路径中提取不同的特征，首先乘以可学习参数，将输入路径特征投影到维的高维空间中。然后，采用多尺度卷积提取不同感受野大小的因果路径信息。通过提取具有不同分辨率的特征，有助于提高模型性能。

（3）具有层次注意机制的特征聚合。在使用L层卷积进行特征提取后，在最后一层引入注意力机制来测量不同的特征重要性，并将其与动态权重融合。该机制由两个层次构成。即：路径的不同卷积尺度上的注意力，以及不同路径上的注意力。

（4）FC层的故障检测结果。最后，采用具有非线性激活函数的全连接层作为分类器，将提取的因果图表示映射到系统状态标签。具体地说，在基于层次注意力的聚合之后的特征向量被馈送到全连接层中。在网络中堆叠隐藏层和输出层以产生故障检测结果。

补充：路径筛选规则

在某些情况下，因果路径可能很多，这会对建模效率产生负面影响，并可能导致过度拟合。此外，在最先进的研究中指出，叶节点和主路径可能包含主要信息。这一发现也可以基于沿着路径的信息传播来证明，即后一个节点可以包含来自祖先节点的信息。因此，为了减少因果路径，并关注主路径和叶节点的特征，开发了一些路径筛选规则如下。

（1）删除包容性关系。如果路径中的所有节点都顺序地包含在中，则定义了和之间的包容关系。由于包含的因果流，为了方便，我们删除了路径。例如，在图2中，包括在中，因此，删除了。

（2）从根节点删除。根节点被定义为没有祖先节点的节点，该节点可能信息量较小。为了提高建模效率，筛选规则为：从一个根节点开始，如果两条路径和（）的连续个节点相同，则删除和的初始节点，并生成新的路径和。图5（a）展示了从的根节点中删除的示例。

（3）叶节点保护。叶节点是没有派生节点的节点，当它们接收祖先节点信息时，派生节点可以提供更多信息。筛选规则为：从叶节点反向开始，如果和（）的连续个节点相同，则路径和将通过只保留最后一个个节点作为新的路径来融合。图5（b）显示了从的叶节点中删除的示例。

图5 一些路径筛选规则的示例

案例验证

在本节中，利用高速列车（HST）制动系统的真实数据进行故障检测，以验证所提出的方法对目标问题的有效性和可解释性。

数据描述

HST制动系统是一个复杂的机电一体化系统，由许多气动、电气和机械子系统组成。考虑到制动系统具有高速减速的重要功能，其是高速列车中最关键系统之一。图6描述了所考虑的双管HST制动系统的简化示意图。即使制动系统现在高度可靠，故障仍可能发生，其后果可能是灾难性的。因此，早期故障检测至关重要。

图6 HST制动系统示意图

在这项工作中，使用了一个关于HST制动系统一年运行的真实数据集来验证所提出方法的有效性。原始数据集中总共记录了43个变量，包括速度、电压、电流、温度、制动模式等。不同类型的传感器会导致数据集的不一致性。具体来说，有21个连续的数值变量和22个离散的分类变量。22个离散变量可以进一步划分为20个非层次变量和2个层次变量。

因果图构造

利用预处理的数据集，通过将经验约束与PC算法相结合的混合因果发现，可以获得制动系统的因果图。具体来说，最初的38+1变量首先分为三类：客观环境变量（如外部温度、运行持续时间），人为因素变量（例如制动模式、访问级别）和系统物理属性变量（例如线路电流、线路电压、悬架压力）。根据实践经验，客观环境和人为因素变量是系统物理属性的祖先节点，客观环境变量与人为因素变量之间的直接因果关系有限。基于前述算法，获得的因果图如图7所示。

图7 HST制动系统的因果图

比较研究

为了验证所提出方法的有效性，采用了一组流行的数据驱动方法进行基准测试，其中包括传统的数据驱动法，即基于径向基核函数的成本敏感SVM（CS-SVM），包括ANN、具有全连接层的CNN（CNN-FC）、1D-ResNet和多尺度CNN（MsCNN）的神经网络，以及最近所提出的基于图的模型，如GCN和多端图注意力网络（MHGAT）。

采用两个指标来衡量不同方法在这些条件下的性能，即F1-measure指标和Matthews相关系数（MCC）得分：

其中，,

表1报告了比较研究的实验结果。从表中可以看出，所提出的HGCAN方法在F1-measure和MCC得分方面都优于基准方法，平均分别提高了6.85%和6.05%。这可以归因于高级表示学习策略，其中因果路径可以提供关于故障因果关系的有效信息。此外，所提出的HGCAN优于其他基于图的方法。GCN和MHGAT是基于邻居节点特征的集成构建的，只考虑局部邻居进行特征提取，而忽略了沿因果路径流动的长程信息。此外，HGCAN还提高了效率，因为它既不需要所有变量，也不需要整个图结构来建模。

表1 HST制动系统的故障检测结果

模型可解释性

所开发的HGCAN也带来了令人满意的故障发展逻辑的可解释性。因果路径聚合的注意力系数可以基于所建立的模型来计算，从而可以量化每个因果路径的贡献，以反映其在影响系统状态中的重要性，从而能够识别关键路径。此外，由于故障因果关系编码在因果路径中，它们反过来可以帮助定位故障原因，并分析在系统监控中发挥关键作用的组件，从而促进维护决策。

如图8所示，HST制动系统数据集的分析表明，路径、和在所有已识别的路径中表现出最高的权重。因此，这些特定路径被认为是HST制动系统内潜在故障发生的关键因素。值得注意的是，变量是一个关键因素，有可能直接导致故障的发生，因为所有三条路径在到达最终系统状态变量之前都会向其汇聚。通过研究这些变量的物理含义，发现橙色和绿色的路径与HST运行模式的不同设置导致的故障有关。另一方面，红色路径与电机牵引相关的故障有关。所有三条路径都指向一组变量，即和，负责测量和控制牵引力和制动力的分配。专家经验也验证了这些途径和变量在影响系统状态中的关键性。

图8 已确定的具有最大关注值的关键路径

结论

本文提出了一个名为HGCAN的复杂机电系统故障检测框架。首先，使用混合因果发现算法来表征高维变量的关系，该算法将先验约束和PC算法相结合。然后，利用图中导致系统状态变量的因果路径进行故障特征提取。考虑到不同的特征重要性，使用分层注意力机制对提取的特征进行融合，以实现规模和路径级别的自适应聚合。该方法使用HST制动系统的实际数据集进行了验证。对比实验表明，该模型具有良好的性能。还探讨了HGCAN在实际故障检测中的可解释性，表明所提出的模型可以帮助识别关键路径和变量，从而有助于后续维护。

目前，本文中将因果关系定义为连接关系是否存在。未来的工作将考虑检查可变连接的强度，并研究节点聚合策略。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

算法

算法

+关注

关注
23

文章
4607

浏览量
92819
图卷积网络

图卷积网络

+关注

关注
0

文章
8

浏览量
1503

原文标题：基于因果路径的层次图卷积注意力网络在复杂机电系统故障检测中的应用

文章出处：【微信号：可靠性杂坛，微信公众号：可靠性杂坛】欢迎添加关注！文章转载请注明出处。

什么是图卷积神经网络？

图卷积神经网络

发表于 08-20 12:05

利用卷积调制构建一种新的ConvNet架构Conv2Former

1、利用卷积探索一种更高效的编码空域特征的方式　　本文旨在通过充分利用卷积探索一种更高效的编码空域特征的方式：通过组合ConvNet与ViT的设计理念，本文利用

发表于 12-19 17:37

一种金字塔注意力网络，用于处理图像语义分割问题

基于以上观察，我们提出了特征金字塔注意力模块 (FPA)，该模块能够融合来自 U 型网络 (如特征金字塔网络 FPN) 所提取的三种不同尺度的金字塔特征。为了更好地提取不同尺度下金字塔

发表于 06-05 09:21 •1.2w次阅读

<b class='flag-5'>一种</b>金字塔<b class='flag-5'>注意力</b><b class='flag-5'>网络</b>，用于处理图像语义分割问题

北大研究者创建了一种注意力生成对抗网络

同时我们还将完整的GAN结构和我们网络的部分相对比：A表示只有自动编码器，没有注意力地图；A+D表示没有注意力自动编码器，也没有注意力判别器；A+AD表示没有

发表于 08-11 09:22 •4959次阅读

什么是图卷积网络?为什么要研究GCN?

下面就让我们来深入了解一下什么是图卷积网络，以及它在行为识别领域的最新工作进展吧！

发表于 06-10 14:07 •2.9w次阅读

循环神经网络卷积神经网络注意力文本生成变换器编码器序列表征

序列表征循环神经网络卷积神经网络注意力文本生成变换器编码器自注意力解码器自注意力残差的重要性图像

发表于 07-19 14:40 •3260次阅读

循环神经<b class='flag-5'>网络</b><b class='flag-5'>卷积</b>神经<b class='flag-5'>网络</b><b class='flag-5'>注意力</b>文本生成变换器编码器序列表征

基于注意力机制的深度学习模型AT-DPCNN

情感分析是自然语言处理领域的一个重要分支，卷积神经网络（CNN）在文本情感分析方面取得了较好的效果，但其未充分提取文本信息中的关键情感信息。为此，建立一种基于

发表于 03-17 09:53 •12次下载

基于<b class='flag-5'>注意力</b>机制的深度学习模型AT-DPCNN

基于注意力机制和多尺度特征融合的网络结构

目前多数利用卷积神经网络进行图像超分辨率重建的方法忽视对自然图像固有属性的捕捉，并且仅在单一尺度下提取特征。针对该问题，提出一种基于注意力机

发表于 03-22 11:18 •16次下载

基于<b class='flag-5'>注意力</b>机制和多尺度特征融合的<b class='flag-5'>网络</b>结构

一种注意力增强的自然语言推理模型aESIM

在自然语言处理任务中使用注意力机制可准确衡量单词重要度。为此，提出一种注意力增强的自然语言推理模型aESM。将词注意力层以及自适应方向权重层添加到ESIM模型的双向LSTM

发表于 03-25 11:34 •9次下载

<b class='flag-5'>一种</b><b class='flag-5'>注意力</b>增强的自然语言推理模型aESIM

基于语音、字形和语义的层次注意力神经网络模型

结合英文幽默语言学特征，提出基于语音、字形和语义的层次注意力神经网络模型（ PFSHAN）进行幽默识别。在特征提取阶段，将幽默文本表示为音素、字符以及携带歧义性等级信息的语义形式，分别采用卷积

发表于 03-26 15:38 •14次下载

一种上下文感知与层级注意力网络的文档分类方法

文档分类是自然语言处理（NLP）领域中的一个基本问题。近年来，尽管针对这一问题的层级注意力网络已经取得了进展，但由于每条句子被独立编码，使得模型中使用的双向编码器仅能考虑到所编码句子的

发表于 04-02 14:02 •3次下载

基于循环卷积注意力模型的文本情感分类方法

和全局信息。文中针对单标记和多标记情感分类任务，提出一种循环卷积注意力模型（ LSTM-CNN-ATT，LCA）。该模型利用注意力机制融合卷积

发表于 04-14 14:39 •10次下载

基于深度图卷积胶囊网络融合的图分类模型

针对提取图表征用于图分类过程中的结构信息提取过程的问题，提出了一种图卷积神经网络与胶囊网络融合的图分类模型。首先，利用图卷积神经

发表于 05-07 15:17 •9次下载

计算机视觉中的注意力机制

计算机视觉中的注意力机制卷积神经网络中常用的Attention 参考 注意力机制简介与分类 注意力机制（Attention Mechan

发表于 05-22 09:46 •0次下载

一种新的深度注意力算法

本文简介了一种新的深度注意力算法，即深度残差收缩网络（Deep Residual Shrinkage Network）。从功能上讲，深度残差收缩网络是

发表于 05-24 16:28 •0次下载

搜索历史

一种基于因果路径的层次图卷积注意力网络

评论

什么是图卷积神经网络？

利用卷积调制构建一种新的ConvNet架构Conv2Former

一种金字塔注意力网络，用于处理图像语义分割问题

北大研究者创建了一种注意力生成对抗网络

什么是图卷积网络?为什么要研究GCN?

循环神经网络卷积神经网络注意力文本生成变换器编码器序列表征

基于注意力机制的深度学习模型AT-DPCNN

基于注意力机制和多尺度特征融合的网络结构

一种注意力增强的自然语言推理模型aESIM

基于语音、字形和语义的层次注意力神经网络模型

一种上下文感知与层级注意力网络的文档分类方法

基于循环卷积注意力模型的文本情感分类方法

基于深度图卷积胶囊网络融合的图分类模型

计算机视觉中的注意力机制

一种新的深度注意力算法