胶囊网络在小样本做文本分类中的应用（下）-电子发烧友网

论文提出Dynamic Memory Induction Networks (DMIN) 网络处理小样本文本分类。

两阶段的（two-stage）few-shot模型：

在监督学习阶段（绿色的部分），训练数据中的部分类别被选为base set，用于finetune预训练Encoder和分类器也就是Pretrained Encoder和Classfiier图中的部分。

在元学习阶段（红色的部分），数据被构造成一个个episode的形式用于计算梯度和更新模型参数。对于C-way K-shot，一个训练episode中的Support Set是从训练数据中随机选择C个类别，每个类别选择K个实例构成的。每个类别剩下的样本就构成Query Set。也就是在Support Set上训练模型，在Query Set上计算损失更新参数。

Pretrained Encoder

用[CLS]预训练的句子的Bert-base Embedding来做fine-tune。$W_{base}$ 就作为元学习的base特征记忆矩阵，监督学习得到的。

Dynamic Memory Module

在元学习阶段，为了从给定的Support Set中归纳出类级别的向量表示，根据记忆矩阵 $W_{base}$ 学习Dynamic Memory Module（动态记忆模块）。

给定一个 $M$ ( $W_{base}$ )和样本向量 q ， q 就是一个特征胶囊，所以动态记忆路由算法就是为了得到适应监督信息 $ W_{base} $ 的向量 $q^{'}$ ，

$$ q^{'} \leftarrow DMR(M, q) $$ 学习记忆矩阵 $M$ 中的每个类别向量 $M^{'} $ 进行更新，

其中

这里的 $W_j$ 就是一个权重。因此变换权重 $W_j$ 和偏差 $b_j$ 在输入时候是可以共享的，因此计算 $\hat{m}{ij}$ 和 $\hat{q}_j$ 之间的皮尔逊相关系数

其中

接下来就是进行动态路由算法学习最佳的特征映射（这里添加了$p_{ij}$到路由协议中），到第11行为止。从第12行开始也会根据监督学习的记忆矩阵和胶囊的皮尔逊相关系数来更新$p_{ij}$，最后把部分胶囊

编辑：jq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

数据

数据

+关注

关注
8

文章
7193

浏览量
89818
Query

Query

+关注

关注
0

文章
11

浏览量
9396
小样本

小样本

+关注

关注
0

文章
7

浏览量
6835
动态路由

动态路由

+关注

关注
0

文章
16

浏览量
23148
网络处理

网络处理

+关注

关注
0

文章
5

浏览量
6380

xgboost在图像分类中的应用

和易用性，在各种机器学习任务中得到了广泛应用，包括分类、回归和排序问题。在图像分类领域，尽管深度学习模型（如卷积神经

发表于 01-19 11:16 •396次阅读

AFE4960如何正确的从FIFO中读取样本呢？

我有一些问题想请教。在双芯片串行模式下，MCU 收到 AFE4960 发送的 FIFO_RDY 中断信号后，开始通过 SPI 通信从 AFE4960 的 FIFO 中读取样本。具

发表于 11-14 06:41

图纸模板中的文本变量

“ 文本变量和系统自带的内置变量，可以帮助工程师灵活、高效地配置标题栏中的信息，而不用担心模板中的文字对象被意外修改。 ” 文本变量的语法文

发表于 11-13 18:21 •242次阅读

RK3588 技术分享 | 在Android系统中使用NPU实现Yolov5分类检测

: NPU帮助机器完成更高效的翻译、文本分类和情感分析，推动了自然语言处理技术的发展。实例分享：Yolov5分类检测在RK3588处理器上，不仅可以基于Linux系统使用NPU，也可以

发表于 10-24 10:13

雷达的基本分类方法

电子发烧友网站提供《雷达的基本分类方法.pdf》资料免费下载

发表于 09-11 09:09 •6次下载

RK3588 技术分享 | 在Android系统中使用NPU实现Yolov5分类检测

: NPU帮助机器完成更高效的翻译、文本分类和情感分析，推动了自然语言处理技术的发展。实例分享：Yolov5分类检测在RK3588处理器上，不仅可以基于Linux系统使用NPU，也可以

发表于 08-20 11:13

利用TensorFlow实现基于深度神经网络的文本分类模型

要利用TensorFlow实现一个基于深度神经网络（DNN）的文本分类模型，我们首先需要明确几个关键步骤：数据预处理、模型构建、模型训练、模型评估与调优，以及最终的模型部署（尽管在本文中，我们将重点放在前四个步骤上）。下面，我将

发表于 07-12 16:39 •981次阅读

BP神经网络样本的获取方法

BP神经网络（Backpropagation Neural Network）是一种基于误差反向传播算法的多层前馈神经网络，广泛应用于模式识别、分类、预测等领域。在构建BP神经

发表于 07-11 10:50 •727次阅读

BP神经网络最少要多少份样本

BP神经网络（Backpropagation Neural Network）是一种多层前馈神经网络，通过反向传播算法进行训练。BP神经网络在许多领域都有广泛的应用，如图像识别、语音识别

发表于 07-11 10:31 •787次阅读

BP神经网络在语言特征信号分类中的应用

Network），即反向传播神经网络，作为一种强大的多层前馈神经网络，凭借其优异的非线性映射能力和高效的学习机制，在语言特征信号分类中展现

发表于 07-10 15:44 •492次阅读

cnn卷积神经网络分类有哪些

卷积神经网络（CNN）是一种深度学习模型，广泛应用于图像分类、目标检测、语义分割等领域。本文将详细介绍CNN在分类任务中的应用，包括基本结构

发表于 07-03 09:28 •794次阅读

卷积神经网络在文本分类领域的应用

显著成就后，也逐渐被引入到文本分类任务中。卷积神经网络通过模拟人类视觉系统的信息处理方式，能够有效地提取文本中的局部特征，进而实现高精度的

发表于 07-01 16:25 •835次阅读

交换机的基本分类

　　交换机作为网络通讯中的核心设备之一，其在网络架构中起着至关重要的作用。随着信息技术的飞速发展，交换机也在不断演进和革新，以满足日益复杂的

发表于 06-06 11:06 •2410次阅读

基于神经网络的呼吸音分类算法

分类器、呼吸（或异常）分类器和某种称为MASK的注意力。该模型的示意图如图1所示。首先，在模型训练之前，将每个声音样本分割在长度相等的帧上。对于声音

发表于 05-31 12:05

了解如何使用PyTorch构建图神经网络

图神经网络直接应用于图数据集，您可以训练它们以预测节点、边缘和与图相关的任务。它用于图和节点分类、链路预测、图聚类和生成，以及图像和文本分类。

发表于 02-21 12:19 •854次阅读

搜索历史

胶囊网络在小样本做文本分类中的应用（下）

评论

xgboost在图像分类中的应用

AFE4960如何正确的从FIFO中读取样本呢？

图纸模板中的文本变量

RK3588 技术分享 | 在Android系统中使用NPU实现Yolov5分类检测

雷达的基本分类方法

RK3588 技术分享 | 在Android系统中使用NPU实现Yolov5分类检测

利用TensorFlow实现基于深度神经网络的文本分类模型

BP神经网络样本的获取方法

BP神经网络最少要多少份样本

BP神经网络在语言特征信号分类中的应用

cnn卷积神经网络分类有哪些

卷积神经网络在文本分类领域的应用

交换机的基本分类

基于神经网络的呼吸音分类算法

了解如何使用PyTorch构建图神经网络