0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

重新思考图卷积网络 GNN只是一种滤波器

DPVg_AI_era 来源:yxw 2019-06-05 09:21 次阅读

最新研究提出,图神经网络仅对特征向量进行低通滤波,不具有非线性流形学习特性。论文提出了一种基于图形信号处理的理论框架,用于分析图神经网络。

图神经网络已成为解决图结构数据机器学习问题的最重要技术之一。

最近关于顶点分类(vertex classification)的工作提出了深度和分布式的学习模型,以实现高性能和可扩展性。

但最近,一篇题为“Revisiting Graph Neural Networks: All We Have is Low-Pass Filters”的论文引起关注,文中提出,图神经网络仅仅是对特征向量进行低通滤波而已。

来自东京工业大学、RIKEN的两位研究人员发现,基准数据集的特征向量对于分类任务来说已经能提供很多有用信息,而图结构仅仅提供了一种对数据进行去燥的方法。

论文提出了一种基于图形信号处理的理论框架,用于分析图神经网络。

作者称,他们的结果表明,图神经网络仅对特征向量进行低通滤波(low-pass filtering),不具有非线性流形学习特性。论文进一步研究了它们对特征噪声的适应力,并对基于GCN的图神经网络设计提出了一些见解。

什么时候应该使用图神经网络?

图神经网络(Graph neural networks, GNN)是一类能够从图结构数据中学习的神经网络。近年来,用于顶点分类和图形同构测试的图神经网络在多个基准数据集上取得了良好的效果,并不断开创新的最先进技术性能。随着ChebNet和GCN在顶点分类方面获得成功,许多GNN变体被提出来解决社交网络、生物学、化学、自然语言处理、计算机视觉和弱监督学习方面的问题。

在半监督顶点分类问题中,我们观察到,图卷积层(GCN)的参数只会导致过拟合。类似的观察在简单的架构(如SGC)和更复杂的脚骨(如DGI)中都曾被报告。

基于这种现象,Felix Wu等人提出将图神经网络简单地看作是特征传播(feature propagation),并提出了一种在许多基准数据集上具有最先进性能的高效模型。Kawamoto等人对图分区设置下未经训练的GCN-like GNNs进行了相关理论评述。

从这些先前的研究中,一个很自然的问题出现了:为什么、以及何时图神经网络在顶点分类任务中表现很好?

换句话说,是否存在一个顶点特征向量的条件,使得图神经网络模型即使没有经过训练也能很好地工作?

那么,我们能否找到基准图神经网络(如SGC或GCN)失败的实际反例?

在本研究中,我们从图信号处理的角度来回答上述问题。在形式上,我们考虑了一个图的半监督学习问题。

给定一个图G = (V, E),每个顶点i∈V都有一个特征x(i)∈x,和标记y(i)∈y,其中x是d维欧氏空间R d, Y = R用于回归, Y ={1,…, c}用于分类。任务是从特征x(i)中学习预测标签y(i)的假设。

然后,我们描述了这个问题的图神经网络解决方案,并对最常用的基准模型GCN及其简化的变体SGC的机制提供了见解。

本研究三大贡献

图信号处理(Graph signal processing, GSP)将顶点上的数据视为信号,应用信号处理技术来理解信号的特征。通过组合信号(特征向量)和图结构(邻接矩阵或邻接矩阵的变换),GSP启发了图结构数据学习算法的发展。在标准信号处理问题中,通常假设观测值包含一些噪声,并且底层的“真实信号”具有低频。这里,我们对我们的问题提出了类似的假设。

假设1:输入特征包括低频真实特征和噪声。真实特征为机器学习任务提供了足够的信息。

本研究的第一个贡献是验证了常用数据集的假设1(第3节)。图1显示了针对不同频率成分(frequency components)的特征训练的2层感知器(MLPs)的性能。在所有基准数据集中,我们看到只有少数频率成分有助于学习。在特征向量中加入更多的频率成分只会导致性能下降。反过来,当我们将高斯噪声N (0, σ2 ) 添加到特征中时,分类精度变得更糟了。

图1:频率成分的精度

最近的许多GNN都是建立在图信号处理的基础上的。最常见的做法是用(增强)规范化邻接矩阵I − L˜ 和矩阵X的特性。在图信号处理的文献中,这种操作在图上过滤信号(filters signals),而不显式地对标准化拉普拉斯矩阵进行特征分解。在这里,我们将这个增强的标准化邻接矩阵及其变体称为可互换的图滤波器(graph filters)和传播矩阵(propagation matrices)。

本研究的第二个贡献表明,将图信号与传播矩阵相乘对应于低通滤波(第4节,尤其是定理3),此外,我们还证明了观测信号与低通滤波器之间的矩阵乘积是真实信号优化问题的解析解。与最近的图神经网络设计原理相比,我们的结果表明图卷积层只是低通滤波(low-pass filtering)。因此,不需要学习图卷积层的参数。

在理论理解的基础上,我们提出了一种新的基准框架,称为gfNN((graph filter neural network, 图滤波神经网络),对顶点分类问题进行了实证分析。

gfNN由两个步骤组成:

通过与图滤波矩阵的乘法实现滤波特性;

通过机器学习模型学习顶点标签。

我们使用图2中的一个简单实现模型演示了框架的有效性。

图2:gfNN的一个简单实现

本研究的第三个贡献是以下定理:

定理2:在假设1下,SGC、GCN和gfNN的结果与使用真实特征的相应神经网络的结果相似。

定理7表明,在假设1下,gfNN和GCN具有相似的高性能。由于gfNN在学习阶段不需要邻接矩阵的乘法,因此它比GCN要快得多。此外,gfNN对噪声的容忍度也更高。

最后,我们将gfNN与SGC模型进行了比较。虽然SGC在基准数据集上计算速度快、精度高,但我们的分析表明,当特征输入是非线性可分的时,SGC会失败,因为图卷积部分对非线性流形学习没有贡献。为了实证证明这个观点,我们创建了一个人工数据集。

实验和结果

为了验证前面提出的观点,我们设计了两个实验。在实验E1中,我们将不同水平的白噪声加入到真实数据集的特征向量中,并比较不同基线模型的分类精度。

在实验E2中,我们研究了一个具有复杂的特征空间的人工数据集,以证明SGC等简单模型在分类时会失败。

表1给出了每个数据集的概述。

表1:用于顶点分类的实际基准数据集和合成数据集

神经网络

图4:Cora(左)、Citeseer(中)和Pubmed(右)数据集上的基准测试精度。噪声水平通过在特征值上增加白噪声的标准差来测量。

图像滤波器的去噪效果

对于每个数据集表1中,我们介绍一个白噪声N(0, 2)为特征向量?范围内(0.01,0.05)。根据定理8和定理7的含义,由于GCN的一阶去噪特性,它对特征噪声的容忍度较低。

随着噪声水平的增加,我们在图4中可以看到,GCN、Logistic回归(LR)和MLP更容易对噪声进行过拟合。另一方面,gfNN和SGC对噪声的容忍度差不多。

图过滤器的表现力

图5:基于两个圆形图案生成的500个数据样本的决策边界

表2:随机train/val/test分段的平均测试精度(5次)

总结

很少有工作涉及GCN架构的限制。Kawamoto等人采用平均场方法对一个简单的GCN模型进行了统计物理分析。他们的结论是,反向传播既不能提高基于GCN的GNN模型的准确性,也不能提高其可检测性。Li et al.在有限的标签数据设置下对多层的GCN模型进行了实证分析,指出如果标签数据太少或者叠加层太多,GCN的性能就会下降。虽然这些结果为GCN提供了很有洞察力的观点,但是它们并没有充分地回答这个问题:我们什么时候应该使用GNN?

我们的结果表明,如果假设1成立,我们应该使用GNN方法来解决给定的问题。从我们的角度来看,从GCN派生出来的GNNs只是简单地执行噪声滤波,并从去噪数据中学习。

基于我们的分析,我们提出了GCN和SGC可能无法执行的两种情况:噪声特征和非线性特征空间。然后,我们提出一个在这两种情况下都能很好地工作的简单方法。

近年来,基于GCN的神经网络在点云分析、弱监督学习等领域得到了广泛的应用。随着输入特征空间的复杂化,我们提议重新审视当前基于GCN的GNNs设计。在计算机视觉中,GCN层并不是卷积层,我们需要把它看作一种去噪机制。因此,简单地叠加GCN层只会给神经网络设计带来过拟合和复杂性。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 滤波器
    +关注

    关注

    160

    文章

    7743

    浏览量

    177719
  • 图像处理
    +关注

    关注

    27

    文章

    1282

    浏览量

    56656
  • 机器学习
    +关注

    关注

    66

    文章

    8381

    浏览量

    132429
  • GNN
    GNN
    +关注

    关注

    1

    文章

    31

    浏览量

    6329

原文标题:重新思考图卷积网络:GNN只是一种滤波器

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    一种基于因果路径的层次图卷积注意力网络

    机电系统中的故障检测对其可维护性和安全性至关重要。然而,系统监测变量往往具有复杂的联系,很难表征它们的关系并提取有效的特征。本文开发了一种基于因果路径的层次图卷积注意力网络(HGCAN),以提高复杂
    的头像 发表于 11-12 09:52 195次阅读
    <b class='flag-5'>一种</b>基于因果路径的层次<b class='flag-5'>图卷积</b>注意力<b class='flag-5'>网络</b>

    网络滤波器坏了会怎样呢

    网络滤波器一种用于过滤网络信号的设备,它能够对信号进行选择性地传输或阻断,从而实现对网络信号的控制和优化。如果
    的头像 发表于 08-25 14:41 576次阅读

    网络滤波器的作用是什么

    网络滤波器一种在通信系统中广泛应用的设备,其主要作用是对信号进行滤波处理,以提高信号的质量和性能。滤波器的设计和应用涉及到许多方面,包括信
    的头像 发表于 08-25 11:19 514次阅读

    低通滤波器、高通滤波器、带通滤波器的简单介绍

    在信号处理领域,滤波器一种重要的电子元件或算法,用于从复杂信号中提取或抑制特定频率成分。其中,低通滤波器、高通滤波器和带通滤波器是最常见的
    的头像 发表于 07-09 18:04 1.2w次阅读
    低通<b class='flag-5'>滤波器</b>、高通<b class='flag-5'>滤波器</b>、带通<b class='flag-5'>滤波器</b>的简单介绍

    卷积神经网络实现示例

    卷积神经网络(Convolutional Neural Network,简称CNN)是一种深度学习模型,主要用于处理具有网格结构的数据,如图像。CNN通过卷积层自动提取图像特征,然后通
    的头像 发表于 07-03 10:51 379次阅读

    卷积神经网络的实现原理

    、训练过程以及应用场景。 卷积神经网络的基本原理 1.1 卷积操作 卷积神经网络的核心是卷积操作
    的头像 发表于 07-03 10:49 496次阅读

    卷积神经网络计算过程和步骤

    卷积层(Convolutional Layer) 卷积层是卷积神经网络的核心组成部分,它通过卷积操作提取输入数据的特征。
    的头像 发表于 07-03 09:36 441次阅读

    卷积神经网络的基本原理和应用范围

    和应用范围。 卷积神经网络的基本原理 1. 卷积层(Convolutional Layer) 卷积层是CNN的核心组成部分,其主要功能是
    的头像 发表于 07-02 15:30 944次阅读

    卷积神经网络在图像识别中的应用

    卷积操作 卷积神经网络的核心是卷积操作。卷积操作是一种数学运算,用于提取图像中的局部特征。在图
    的头像 发表于 07-02 14:28 947次阅读

    巴特沃斯滤波器是模拟滤波器

    巴特沃斯滤波器一种模拟滤波器,也是一种在频域设计中常用的滤波器类型。
    的头像 发表于 05-22 15:39 656次阅读

    高通滤波器和低通滤波器的区别

    在电子信号处理的领域中,滤波器一种至关重要的工具,它们能够按照特定的频率特性对信号进行筛选和处理。高通滤波器和低通滤波器是两常见的
    的头像 发表于 05-21 15:51 4486次阅读

    什么是低通滤波器?低通滤波器有什么作用?

    在电子工程领域中,滤波器一种用于信号处理的重要元件。而低通滤波器作为滤波器一种类型,具有其独特的频率响应特性。本文维爱普电源
    的头像 发表于 04-08 16:30 2924次阅读
    什么是低通<b class='flag-5'>滤波器</b>?低通<b class='flag-5'>滤波器</b>有什么作用?

    声表滤波器与双工一种东西吗?它们之间有什么不同?

    声表滤波器与双工一种东西吗?它们之间有什么不同?  声表滤波器和双工不是一种东西,它们分别
    的头像 发表于 02-01 16:44 1262次阅读

    一种八腔带通腔体滤波器的设计方法

    摘 要: 介绍了一种八腔带通腔体滤波器的设计方法。结合仿真软件SuperFilter与Ansoft HFSS的三维场仿真,能极大减少设计微波腔体滤波器的时间和成本。通过对模型的仿真和优化,最终设计出来的
    的头像 发表于 12-16 16:51 1785次阅读
    <b class='flag-5'>一种</b>八腔带通腔体<b class='flag-5'>滤波器</b>的设计方法

    如何实现一种具有介质腔与金属腔体混合的新型带通滤波器的设计?

    设计了一种新型的滤波器,就是在传统的腔体滤波器中加入介质谐振腔,即金属腔体和介质腔体混合的一种结构.这种混合结构有着介质腔体的高介电常数
    的头像 发表于 12-11 10:00 1272次阅读
    如何实现<b class='flag-5'>一种</b>具有介质腔与金属腔体混合的新型带通<b class='flag-5'>滤波器</b>的设计?