0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用于改进文本分类的特征投影

深度学习自然语言处理 来源:深度学习自然语言处理 作者:深度学习自然语言 2021-03-05 15:35 次阅读

TL; DR

在情感分类中,一些good features,比如”good“、”nice“表示积极,”bad“、“terrible”表示消极。但是,还有许多common features,比如voice、screen就没有特别的情感性。

尽管深度学习拥有强大的representation learning(表征学习,即同一个数据用不同的表示形式)。但我们认为还有可以改进的地方。

在本文中,我们提出了一种新的角度来进一步改善这种表示学习,即特征投影(feature projection):将现有特征投影到common特征的正交空间中。

所得的投影向量垂直于common特征,能更好的进行分类。

将该方法用于改进基于CNN,RNN,Transformer和Bert的文本分类模型,获得更好的结果。

网络结构

Feature Purification Network 特征净化网络

模型分为两部分:

projection network (P-net);

common feature learning network (C-net)

P-net:计算净化的向量特征,通过将学习到的输入文本的信息向量投影到更具区分性的语义空间中来消除共同特征的影响。

C-net:提取common features。

P-net由四部分组成:

输入层X

特征提取器Fp

正交投影层(OPL,Orthogonal Projection Layer)

分类层Cp

C-net也由四部分组成:

输入层X

特征提取器Fc(Fp和Fc的参数不共享)

渐变反向层(GRL,Gradient Reverse Layer)

分类层Cc

技术的关键思想如下:

P-Net中特征向量fp投影到C-Net的fc的正交方向上。也就是说,将fp(从输入文档中提取的完整信息)投影到更具区分性的语义空间中,以进行最终分类。

图2:正交投影层的工作方式。这里的示例是在二维空间中。

fp表示传统特征向量;

fc表示公共特征向量;

fp∗是投影特征向量;

fp~是最终的正交投影特征向量。

我们首先将传统特征向量fp投影到共同特征向量fc,得到fp∗。

等式9中的fp∗即表示对共同特征向量fc的约束。

再将fp投影到fp-fp*得到fp~

也就是说:通过将输入的传统特征向量fp投影到公共特征向量fc来限制公共特征向量的模,因此新的公共特征向量fp*的语义信息仅包含xi的公共语义信息。

这使得最终的纯化特征向量fp~来自传统特征向量fp,而不是与公共特征向量fc正交的任何平面中的任何向量。

最后,我们使用纯化的特征向fp~进行分类。

Experiments实验

1 实验使用数据集

2 Baselines模型

用LSTM、CNN、Transformer和BERT等基准模型进行对比实验,已验证特征投射的有效性。

3 实施细节

首先,我们将实验中的所有词嵌入随机初始化为200维向量,然后在训练过程中进行修改(Bert除外)。对于每种类型的特征提取器,我们具有以下配置:

对于RNN模型,使用两层LSTM进行特征提取,每层的hidden state=256;

对于CNN模型,为了获得更多的细粒度特征,我们分别使用了[2,3,4,5,6]的滤波器大小,每个滤波器都有100个特征图。

对于Transformer的模型,我们使用Transformer的编码器作为特征提取器,使用单头和3个block。

对于Bert模型,我们微调了预训练的基于Bert的参数。这些设置与FP-Net中的基线完全相同。

在C-net模块的训练中,我们以0.9为初始学习率的随机梯度和随后的退火学习率(Ganin and Lempitsky,2014)。

其中,训练进度p从0线性变化为1,l0 = 0.01,α= 10和β= 0.75。在GRL中,超参数λ为[0.05,0.1,0.2,0.4,0.8,1.0]。

4 实验结果

5 消融实验与分析

消融实验类似于“控制变量法”。假设在某任务中,使用了A,B,C,取得了不错的效果,但是这个时候你并不知道效果是由A,B,C中哪一个起的作用,于是你保留A,B,移除C进行实验来看一下C在整个任务中所起的作用。

结论

在本文中,我们提出了一种新的特征净化网络(FP-Net),以改进文本分类的表示;

该方法基于特征投影。所提出的模型使用两个子网,一个用于识别对分类没有区别的共同特征common features,另一个用于将传统特征投射到共同特征的正交方向的特征投影;

我们当前的方法仅用于传统文本分类方法,例如LSTM,CNN和Transformer。在未来的工作中,我们将考虑将其扩展到基于图的方法(例如用于图形数据的GCN),以及扩展到基于生成的方法(例如用于对抗性学习的GAN)。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 文本分类
    +关注

    关注

    0

    文章

    18

    浏览量

    7289
  • 深度学习
    +关注

    关注

    73

    文章

    5492

    浏览量

    120975
  • cnn
    cnn
    +关注

    关注

    3

    文章

    351

    浏览量

    22168

原文标题:【ACL2020】用于改进文本分类的特征投影

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    图纸模板中的文本变量

    进行定义。无论是系统内置的变量,还是用户自定义的变量,都以这种方式表述。 系统内置文本变量 以下表格展示系统内置的文本变量,无需定义,可以直接使用: 比如说,如果在图纸编辑器中定义了以下标题栏: 当该图纸模板应用于原理图或PCB
    的头像 发表于 11-13 18:21 116次阅读
    图纸模板中的<b class='flag-5'>文本</b>变量

    雷达的基本分类方法

    电子发烧友网站提供《雷达的基本分类方法.pdf》资料免费下载
    发表于 09-11 09:09 6次下载

    利用TensorFlow实现基于深度神经网络的文本分类模型

    要利用TensorFlow实现一个基于深度神经网络(DNN)的文本分类模型,我们首先需要明确几个关键步骤:数据预处理、模型构建、模型训练、模型评估与调优,以及最终的模型部署(尽管在本文中,我们将重点放在前四个步骤上)。下面,我将详细阐述这些步骤,并给出一个具体的示例。
    的头像 发表于 07-12 16:39 693次阅读

    BP神经网络在语言特征信号分类中的应用

    随着人工智能技术的飞速发展,语言特征信号分类作为语音识别、语种识别及语音情感分析等领域的重要基础,正逐渐受到研究者的广泛关注。BP神经网络(Back Propagation Neural
    的头像 发表于 07-10 15:44 314次阅读

    深度学习中的时间序列分类方法

    的发展,基于深度学习的TSC方法逐渐展现出其强大的自动特征提取和分类能力。本文将从多个角度对深度学习在时间序列分类中的应用进行综述,探讨常用的深度学习模型及其改进方法,并展望未来的研究
    的头像 发表于 07-09 15:54 705次阅读

    全息投影呈现什么影像特征

    全息投影技术是一种利用光的干涉和衍射原理,将物体的三维信息记录在全息图上,并通过适当的光源再现物体的三维影像的技术。全息投影技术具有许多独特的影像特征,以下是对这些特征的介绍: 三维性
    的头像 发表于 07-08 11:15 602次阅读

    cnn卷积神经网络分类有哪些

    卷积神经网络(CNN)是一种深度学习模型,广泛应用于图像分类、目标检测、语义分割等领域。本文将详细介绍CNN在分类任务中的应用,包括基本结构、关键技术、常见网络架构以及实际应用案例。 引言 1.1
    的头像 发表于 07-03 09:28 469次阅读

    卷积神经网络在文本分类领域的应用

    显著成就后,也逐渐被引入到文本分类任务中。卷积神经网络通过模拟人类视觉系统的信息处理方式,能够有效地提取文本中的局部特征,进而实现高精度的文本分类。本文将对卷积神经网络在
    的头像 发表于 07-01 16:25 619次阅读

    交换机的基本分类

      交换机作为网络通讯中的核心设备之一,其在网络架构中起着至关重要的作用。随着信息技术的飞速发展,交换机也在不断演进和革新,以满足日益复杂的网络需求。本文将对交换机的分类及其特点进行详细介绍,以期为读者提供清晰、深入的理解。
    的头像 发表于 06-06 11:06 1618次阅读

    基于神经网络的呼吸音分类算法

    分类器、呼吸(或异常)分类器和某种称为MASK的注意力。该模型的示意图如图1所示。 首先,在模型训练之前,将每个声音样本分割在长度相等的帧上。对于声音样本只有一个异常标签,对于每个帧只有一个噪声标签
    发表于 05-31 12:05

    咳嗽检测深度神经网络算法

    哮喘、支气管炎和百日咳发生时的咳嗽音频信号的方法。在此,使用巴特沃斯高通滤波器进行预处理,并使用MFCC进行特征提取。此外,使用咳嗽特征的训练数据集,使用改进的CNN完成了咳嗽声音的分类
    发表于 05-15 19:05

    不同种植设施背景蔬菜作物无人机高光谱精细分类2.0

    SVM-Linear方法,SVM-RBF模型采用RBF核函数将原始特征光谱空间投影到更加高维空间,以解决线性不可分问题,理论上应该可以得到更好的分类结果。然而在本实验中,SVM-RBF模型并没有体现出更加强大的优势,反而在西瓜、
    的头像 发表于 03-21 11:19 441次阅读

    了解如何使用PyTorch构建图神经网络

    图神经网络直接应用于图数据集,您可以训练它们以预测节点、边缘和与图相关的任务。它用于图和节点分类、链路预测、图聚类和生成,以及图像和文本分类
    发表于 02-21 12:19 716次阅读
    了解如何使用PyTorch构建图神经网络

    投影融合系统:技术解析与未来展望

    投影融合系统是一种先进的投影技术,它将多台投影仪投射出的画面进行边缘重叠,并通过融合技术形成一个无缝、高分辨率的整幅画面。这种技术广泛应用于商业展览、家庭娱乐、教育等领域,为人们带来了
    的头像 发表于 02-01 14:50 1071次阅读

    人工智能中文本分类的基本原理和关键技术

    在本文中,我们全面探讨了文本分类技术的发展历程、基本原理、关键技术、深度学习的应用,以及从RNN到Transformer的技术演进。文章详细介绍了各种模型的原理和实战应用,旨在提供对文本分类技术深入理解的全面视角。
    的头像 发表于 12-16 11:37 1176次阅读
    人工智能中<b class='flag-5'>文本分类</b>的基本原理和关键技术