0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

胶囊网络在小样本做文本分类中的应用(下)

智能生物识别说 来源:KuAI_KST 作者:KuAI_KST 2021-09-27 17:46 次阅读

论文提出Dynamic Memory Induction Networks (DMIN) 网络处理小样本文本分类。

pIYBAGCnY4mABa0KAACqrnD7xg418.jpeg

两阶段的(two-stage)few-shot模型:

在监督学习阶段(绿色的部分),训练数据中的部分类别被选为base set,用于finetune预训练Encoder和分类器也就是Pretrained Encoder和Classfiier图中的部分。

在元学习阶段(红色的部分),数据被构造成一个个episode的形式用于计算梯度和更新模型参数。对于C-way K-shot,一个训练episode中的Support Set是从训练数据中随机选择C个类别,每个类别选择K个实例构成的。每个类别剩下的样本就构成Query Set。也就是在Support Set上训练模型,在Query Set上计算损失更新参数。

Pretrained Encoder

用[CLS]预训练的句子的Bert-base Embedding来做fine-tune。$W_{base}$ 就作为元学习的base特征记忆矩阵,监督学习得到的。

Dynamic Memory Module

在元学习阶段,为了从给定的Support Set中归纳出类级别的向量表示,根据记忆矩阵 $W_{base}$ 学习Dynamic Memory Module(动态记忆模块)。

pIYBAGCnY6mATu11AACt6b83rQg92.jpeg

给定一个 $M$ ( $W_{base}$ )和样本向量 q , q 就是一个特征胶囊,所以动态记忆路由算法就是为了得到适应监督信息 $ W_{base} $ 的向量 $q^{'}$ ,

pIYBAGCnZCuAfxHgAAANyMjahgg865.jpg

$$ q^{'} \leftarrow DMR(M, q) $$ 学习记忆矩阵 $M$ 中的每个类别向量 $M^{'} $ 进行更新,

pIYBAGCnY9SAUs5YAAAY8n18FQ8274.jpg

其中

o4YBAGCnZFSAXoF4AAAQ5xcaJKE275.jpg

这里的 $W_j$ 就是一个权重。因此变换权重 $W_j$ 和偏差 $b_j$ 在输入时候是可以共享的, 因此计算 $\hat{m}{ij}$ 和 $\hat{q}_j$ 之间的皮尔逊相关系数

pIYBAGCnZVGAW4_CAAAUK-tFvfw171.jpg

其中

o4YBAGCnZZSAc4R5AABHPGmry5I894.png

接下来就是进行动态路由算法学习最佳的特征映射(这里添加了$p_{ij}$到路由协议中),到第11行为止。从第12行开始也会根据监督学习的记忆矩阵和胶囊的皮尔逊相关系数来更新$p_{ij}$,最后把部分胶囊

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7002

    浏览量

    88941
  • Query
    +关注

    关注

    0

    文章

    11

    浏览量

    9347
  • 小样本
    +关注

    关注

    0

    文章

    7

    浏览量

    6821
  • 动态路由
    +关注

    关注

    0

    文章

    16

    浏览量

    23117
  • 网络处理
    +关注

    关注

    0

    文章

    5

    浏览量

    6337
收藏 人收藏

    评论

    相关推荐

    AFE4960如何正确的从FIFO读取样本呢?

    我有一些问题想请教。 双芯片串行模式,MCU 收到 AFE4960 发送的 FIFO_RDY 中断信号后,开始通过 SPI 通信从 AFE4960 的 FIFO 读取样本。 具
    发表于 11-14 06:41

    图纸模板文本变量

    “  文本变量和系统自带的内置变量,可以帮助工程师灵活、高效地配置标题栏的信息,而不用担心模板的文字对象被意外修改。   ” 文本变量的语法
    的头像 发表于 11-13 18:21 170次阅读
    图纸模板<b class='flag-5'>中</b>的<b class='flag-5'>文本</b>变量

    RK3588 技术分享 | Android系统中使用NPU实现Yolov5分类检测

    : NPU帮助机器完成更高效的翻译、文本分类和情感分析,推动了自然语言处理技术的发展。 实例分享:Yolov5分类检测 RK3588处理器上,不仅可以基于Linux系统使用NPU,也可以
    发表于 10-24 10:13

    雷达的基本分类方法

    电子发烧友网站提供《雷达的基本分类方法.pdf》资料免费下载
    发表于 09-11 09:09 6次下载

    RK3588 技术分享 | Android系统中使用NPU实现Yolov5分类检测

    : NPU帮助机器完成更高效的翻译、文本分类和情感分析,推动了自然语言处理技术的发展。 实例分享:Yolov5分类检测 RK3588处理器上,不仅可以基于Linux系统使用NPU,也可以
    发表于 08-20 11:13

    利用TensorFlow实现基于深度神经网络文本分类模型

    要利用TensorFlow实现一个基于深度神经网络(DNN)的文本分类模型,我们首先需要明确几个关键步骤:数据预处理、模型构建、模型训练、模型评估与调优,以及最终的模型部署(尽管本文中,我们将重点放在前四个步骤上)。下面,我将
    的头像 发表于 07-12 16:39 831次阅读

    BP神经网络样本的获取方法

    BP神经网络(Backpropagation Neural Network)是一种基于误差反向传播算法的多层前馈神经网络,广泛应用于模式识别、分类、预测等领域。构建BP神经
    的头像 发表于 07-11 10:50 568次阅读

    BP神经网络最少要多少份样本

    BP神经网络(Backpropagation Neural Network)是一种多层前馈神经网络,通过反向传播算法进行训练。BP神经网络许多领域都有广泛的应用,如图像识别、语音识别
    的头像 发表于 07-11 10:31 556次阅读

    BP神经网络语言特征信号分类的应用

    Network),即反向传播神经网络,作为一种强大的多层前馈神经网络,凭借其优异的非线性映射能力和高效的学习机制,语言特征信号分类展现
    的头像 发表于 07-10 15:44 386次阅读

    卷积神经网络文本分类领域的应用

    显著成就后,也逐渐被引入到文本分类任务。卷积神经网络通过模拟人类视觉系统的信息处理方式,能够有效地提取文本的局部特征,进而实现高精度的
    的头像 发表于 07-01 16:25 703次阅读

    交换机的基本分类

      交换机作为网络通讯的核心设备之一,其在网络架构起着至关重要的作用。随着信息技术的飞速发展,交换机也不断演进和革新,以满足日益复杂的
    的头像 发表于 06-06 11:06 1907次阅读

    基于神经网络的呼吸音分类算法

    分类器、呼吸(或异常)分类器和某种称为MASK的注意力。该模型的示意图如图1所示。 首先,模型训练之前,将每个声音样本分割在长度相等的帧上。对于声音
    发表于 05-31 12:05

    了解如何使用PyTorch构建图神经网络

    图神经网络直接应用于图数据集,您可以训练它们以预测节点、边缘和与图相关的任务。它用于图和节点分类、链路预测、图聚类和生成,以及图像和文本分类
    发表于 02-21 12:19 752次阅读
    了解如何使用PyTorch构建图神经<b class='flag-5'>网络</b>

    基于微流控技术的灭火微胶囊研究

    直径500微米的胶囊有多大魔力?12月28日,中国科学技术大学先进技术研究院微流体应用研究中心里,副主任黄芳胜向我们展示了微胶囊的“过人之处”。
    的头像 发表于 01-02 09:25 855次阅读

    新技术在生物样本冷冻的应用案例分析

    可以提供关于样本冻结和解冻过程的重要信息,还可用于研究生物分子低温条件的行为,从而推动了相关领域的研究进展。   二、新技术在生物样本冷冻
    发表于 12-26 13:30