融合零样本学习和小样本学习的弱监督学习方法综述

来源：《系统工程与电子技术》，作者潘崇煜等

摘要: 深度学习模型严重依赖于大量人工标注的数据，使得其在数据缺乏的特殊领域内应用严重受限。面对数据缺乏等现实挑战，很多学者针对数据依赖小的弱监督学习方法开展研究，出现了小样本学习、零样本学习等典型研究方向。对此，本文主要介绍了弱监督学习方法条件下的小样本学习和零样本学习，包括问题定义、当前主流方法以及实验设计方案，并对典型模型的分类性能进行对比。然后，给出零-小样本学习的问题描述，总结研究现状和实验设计，并对比典型方法的性能。最后，基于当前研究中出现的问题对未来研究方向进行展望，包括多种弱监督学习方法的融合与理论基础的探究，以及在其他领域的应用。

关键词: 弱监督学习; 小样本学习; 零样本学习; 零-小样本学习

0 引言

近年来,深度学习模型在诸多领域取得了引人瞩目的成就,如图像分类、语音识别、棋类对弈等。然而,包括深度学习在内,以大数据为基础的传统监督学习模型严重依赖于大量人工标注的高质量标签数据,在很多领域内,由于数据缺乏,使得这些模型很难取得应有成效。针对数据缺乏的现实情况,当前很多研究[1-2]关注数据依赖性小的弱监督学习方法,如小样本学习、零样本学习等。

小样本学习试图在有限样本条件下实现对新类别或新概念的有效认知。通过度量学习、样本生成等途径,已有一些方法在少量支持样本情况下实现了新概念识别。尽管取得了一定成效,但每个新类别中的几个支持样本仍然难以准确表征整个类别的特征分布,这使得小样本学习任务仍然充满了挑战性。

相对于小样本学习,零样本学习试图识别训练过程中从未见过的新类别概念。这需要额外的语义特征辅助信息,如训练集和待分类的测试集类别语义特征描述向量,借此实现从训练集向测试集类别的知识迁移。由于其内在固有的域适应及枢纽度问题[3],零样本学习也面临着识别精度不高等问题。

基于零样本学习和小样本学习面临诸多的问题,正如文献[3]指出,在当前小样本学习中融合额外的语义文本信息是一个重要的研究方向,即零-小样本学习。零-小样本学习既包含了小样本学习中若干支持样本特征,同时考虑了语义特征辅助信息,可以有效提高弱监督机器学习的识别性能,同时也更加符合人类对新概念、新事物举一反三、多方融合的认知原理。

本文从小样本学习和零样本学习入手,重点开展了问题描述、典型方法介绍、实验设计以及性能对比。基于小样本学习和零样本学习之间的信息互补,本文介绍了零-小样本学习这一新问题。在此基础上,本文指出了多种弱监督学习方法融合发展、基础理论探索以及多领域上扩展等重要发展方向。

1 小样本学习

小样本学习旨在通过有限样本对新的类别或者概念进行识别,本节首先给出明确问题描述,之后回顾目前主流方法和模型,最后介绍具体的实验设计和部分基准结果。

1.1 问题描述

给定由Ns个训练样本构成的训练集

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

其中

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

是第i个样本图像；

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

是其类别标签,Cs是训练集标签集合;Ds通常由大量训练样本构成。

在测试阶段,对于新的类别Ct (测试类别与训练集类别不同,即Cs∩ Ct=∅),每个类别给定几个支持样本

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

小样本识别的任务是对新的测试样本图像

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

进行识别,确定其对应的类别标签

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

1.2 当前主流模型

小样本学习领域目前已经出现很多方法和模型,这些方法可以概括为基于度量的方法、基于优化的方法、基于生成式模型的方法、基于图神经网络的方法以及基于记忆单元的方法。表1对这几种主流方法进行了简要列举和分析。

表1 不同的小样本学习方法对比分析
Table 1 Comparision analysis of the different methods for few-shot learning

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

(1) 基于度量的方法

基于度量的方法核心思想是学习样本之间的相似度。孪生网络[4]是最早的基于度量学习的小样本学习模型,该模型通过卷积神经网络(convolutional neural network, CNN)直接学习两个样本之间的相似度。之后,文献[5]提出了基于元学习的匹配网络,元学习是一种训练策略,具体算法流程如表2所示。

表2 元学习训练范式
Table 2 Training paradigm of the meta-learning

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

匹配网络利用了双向长短时记忆(long short-term memory, LSTM)网络模型以及注意力机制来学习样本之间的度量函数。原型网络[6]也是一种典型的度量学习模型,将图像特征映射到一度量空间中,在该空间中,将同类多个样本均值作为代表该类别的原型样本点,对于待识别的样本,通过在多类的原型样本点之间进行最近邻距离实现分类,该方法直接用欧氏距离作为距离度量,仅学习图像编码网络。值得一提的是,文献[7-8]提出了包含图像编码模块及关系度量模块的关系网络,原始图像经过CNN编码模块形成图像特征向量,之后待测试样本与支持样本连接形成图像对,经过关系网络度量每一图像对的相似度。如图1所示[7],该模型同时学习编码网络和度量函数,与以往使用某一固定度量函数不同,该模型通过训练学习了一个非线性的度量函数,提高了模型的适应性。

基于度量的小样本学习方法模型通常较为直观,易于理解,具备较强的可解释性,但往往需要大量训练数据,对于训练集样本数量要求较高,且最终性能对模型结构敏感度较高,模型细节设计对性能影响较大。

(2) 基于优化的方法

基于优化的方法依据元学习的思想,旨在学习一组元分类器,这些分类器可以在新的任务上通过参数微调实现较好的分类性能。最典型的优化方法是模型无关元学习(model-agnostic meta-learning, MAML)算法[9],如图2所示,该方法通过大量训练数据学习到一组好的初始化参数,在新任务测试时,仅通过很少的参数迭代步数,模型即可自适应到该新任务上。基于元学习思想,之后又出现了很多基于优化的小样本学习方法,包括meta network[10]、meta-SGD[11]、meta-learner LSTM[12]以及其他变种[13]。

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

图1 基于度量的小样本学习模型-关系网络
Fig.1 Metric based model for few-shot learning-relation network

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

图2 基于优化的小样本学习方法-MAML算法
Fig.2 Optimization based method for few-shot learning-MAML algorithm

基于优化的小样本学习模型具备快速适应新任务的能力,但却存在明显的缺陷,即模型只能在固定任务上预训练和迁移,如在5-way 1-shot分类任务上训练的模型只能适应5-way 1-shot的任务,缺乏灵活性。

(3) 基于生成式模型的方法

基于大量训练数据以及少量的支持样本,生成式模型期望生成大量新类别数据样本,进而将小样本学习转化为传统的监督学习。生成式模型通常由自动编码器以及其他学习模型构成[14]。典型的生成式模型如图3所示[15]。

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

图3 基于生成式模型的小样本学习方法
Fig.3 Generative model based method for few-shot learning

通过类比训练集中多个样本之间的特征差异,在少量支持样本的基础上,生成器试图在新类别上生成更多样本。随后,在生成样本基础上训练常规分类器进行新类别识别。近年来,随着生成对抗网络(generative adversarial network, GAN)[16]的出现,基于GAN的小样本学习模型[17]也层出不穷。

基于生成式模型的方法通常分为样本生成和分类器训练两部分分步进行,易于追溯,但却存在生成样本可信度不高、模型训练困难等问题。

(4) 基于图神经网络的方法

在图神经网络模型[18]中,以单个样本作为节点(Node),以样本间相似度作为边(Edge),通过神经网络模型迭代计算图模型的连接矩阵。如图4所示,以所有样本的特征向量作为节点状态,以样本间关系为边,迭代更新节点状态向量和邻接矩阵,最终推断出待识别样本与所有支持样本的相似度[19]。

由于将每个样本作为一个高维向量节点进行动态更新,基于图神经网络的方法[19-20]在模型训练过程中会消耗大量内存空间,同时计算量会随着样本数量增加而激增。

图4 基于图神经网络的小样本学习方法
Fig.4 Graph neural network based method for few-shot learning

(5) 基于记忆单元的方法

基于外挂的记忆单元模块,一些方法试图通过在学习过程中持续更新内存状态来实现小样本学习甚至持续学习[21],典型方法包括记忆增强网络(memory augmented neural network, MANN)[22]、记忆匹配网络(memory matching network, MMN)[23]等。

基于记忆单元的小样本学习方法模型,如图5所示,可动态更新,但需额外增加外置记忆单元,增大了内存需求,同时也增加了如读写控制器等复杂模型组件[22]。

图5 基于记忆单元的小样本学习-MANN
Fig.5 Memory unit based method for few-shot learning-MANN

1.3 实验设计

(1) 数据集

当前,小样本学习的公共数据集主要是Omniglot以及miniImagenet。其中,Omniglot[24]是手写字符符号数据集,包含50个大类,共1 623个类别符号,每个类别只有20个样本图像。miniImagenet[5]是图像领域公共数据集ImageNet的一部分,包含100个类别,每个类别包含600个图像样本,在小样本学习中具体划分为64类用于训练集,16类用于验证集,其余20类用于测试集。

(2) 实验设置

如表2所示,小样本学习普遍采用元学习训练范式,在训练阶段和测试阶段构建分类子任务,称为M-way N-shot Q-query分类子任务,即每一个实验轮次中,对于M类分类类别,每一类别提供N个支持样本,同时提供Q个测试样本用于参数调整(训练阶段)或准确率评估(测试阶段)。在模型训练阶段,通过多个轮次迭代,实现模型参数的调整。在模型测试阶段,采用多个轮次分类准确率取平均值的方法,评估模型最终的分类准确率。当前研究通常在Omniglot数据集上采用5/20-way 1/5-shot的分类子任务,在miniImagenet数据集上采用5-way 1/5-shot的分类子任务。

表3 几种典型小样本学习模型在miniImagenet数据集上的性能对比

Table 3 Performance evaluations of the several typical models for few-shot learning on miniImagenent data sets

(3) 典型方法性能对比

表3列出了小样本学习领域当前几种典型模型在miniImagenet数据集上的识别准确率对比。可以看出,大部分方法在5-way 1-shot分类识别中都取得了超过50%的准确率,表明仅依靠少量标签样本识别新类具有一定的实践性。同时,随着支持样本的增加(由1-shot增加为5-shot),识别率取得了明显的提高,表明支持样本数量对最终识别效果有决定性作用。最后,不同模型不仅设计思想及模型构成不同,而且在图像处理中最基本的特征提取器结构也存在很大区别(如表3特征提取器所列),因此模型性能之间存在较大差异。

2 零样本学习

零样本学习[29-30]旨在通过文本描述信息对新的类别或者概念进行识别,本节首先给出明确问题描述,之后回顾目前主流方法和模型,最后介绍具体的实验设计和部分基准结果。

2.1 问题描述

给定由Ns个训练样本构成的训练集,

其中

是第i个样本图像,

是其类别标签,Cs是训练集标签集合。零样学习的任务是对测试样本

进行识别,将其划分到新的类别Ct中,即确定其对应的类别标签

其中测试类别与训练集类别不同,即Cs∩Ct=∅。除此之外,零样本学习为所有类别提供了额外的文本信息作为特征描述,即为Cs和Ct中的每个类别

提供了一个类别特征描述向量

借助于通用的类别特征描述向量,零样本学习期望实现从已知的训练样本类别到新的测试样本类别之间的知识迁移。在零样本学习中,类别描述向量作为知识迁移的桥梁,通常是由人工标注的属性向量构成,如形状、颜色、尺寸、材质等训练集和测试集类别通用属性,也有一些研究使用文本理解领域成熟的词向量作为特征描述向量[3]。

2.2 当前主流模型

针对零样本学习问题,国内外学者提出了很多方法,整体上可分为度量学习方法、相似度学习方法、基于流形结构的方法以及基于生成式模型的方法。表4对这几种主流方法进行了简要列举和分析。

表4 不同零样本学习方法对比分析
Table 4 Comparisions of the different methods for zero-shot learning

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

(1) 度量学习方法

度量学习方法旨在找到一个度量空间,在该空间中样本的图像特征和其对应的语义向量在某种度量下距离最小。最基本的方法是直接将语义向量空间作为度量空间[31-33],将图像特征映射到语义向量空间,在该空间中进行最近邻分类,直接使用欧氏距离或者余弦距离作为度量函数。有研究表明[34],将图像特征空间作为度量空间,能够有效减轻零样本学习中固有的域适应以及枢纽度问题[3]。在此基础上,以图像特征空间作为度量空间的深度嵌入模型(deep embedding model， DEM)[35-36]等模型被提出,如图6所示[35],原始图像经过CNN网络编码到图像特征空间,语义向量经多层感知机(multi-layer perceptron, MLP)映射到同一特征空间,在该度量空间中基于最近邻分类。除了图像特征以及语义特征空间本身,一些方法探索了寻找隐空间作为度量空间,如EXEM[37]、隐性属性字典(latent attribute dictionary, LAD)[38]学习、耦合字典学习(coupled dictionary learning, CDL)[39]、公共嵌入空间[40-41]以及共享特征相对属性空间[42]。在这些方法中,除了度量空间不同,空间映射函数也各有不同,包括线性变换[31,38-39,43]以及非线性变换,如支持向量回归(support vector regression, SVR)[37]以及神经网络模型[35]。度量学习方法中最重要的问题是设计目标(损失)函数,关系到模型的整体性能。

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

图6 基于度量的零样本学习
Fig.6 Metric based zero-shot learning

基于度量学习的方法在某一特征空间中基于最近邻规则进行分类,模型直观、易于理解,然而模型性能因度量空间选择而变化较大,适用于训练集数量较大的情况。

(2) 兼容性学习方法

与学习空间映射函数不同,兼容性学习方法直接学习图像空间和语义空间向量的相似度。最基本的方法是直接利用双线性函数将图像空间和语义空间向量转换为相似度标量,如极端零样本学习采样方法(embarrassingly sample approach to zero-shot learning, ESZSL)[44]、深度图像-嵌入语义(deep visual-semantic embedding， DeViSE)模型[45]、结构化联合嵌入(structured joint embedding,SJE)[46]以及属性标签嵌入(attribute label embedding, ALE)[47]。其他一些方法利用了非线性的函数转换,如隐形嵌入(latent embedding, LatEm)[48]以及关系网络[7]。

基于兼容性学习的方法模型如图7所示[46],较为简单,计算量较小,但对训练集数据量要求较高。

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

图7 基于兼容性的零样本学习
Fig.7 Compatibility based zero-shot learning

(3) 基于流形结构的方法

一些研究从流形学习[49]的角度出发,探索语义空间与图像特征空间的流形结构,企图通过学习训练集中的流形结构,迁移到新的测试类别中去。如图8所示,模型在语义空间中学习各个类别特征向量间的流形结构,基于流形学习思想,将该结构迁移到视觉特征分类器模型空间中。典型方法包括跨模态迁移(cross-modal transfer, CMT)[50]、数据遗失问题(missing data problem, MDP)[51]、语义嵌入凸组合(convex combination of semantic embeddings, CONSE)[52]、双向隐形嵌入(bidirectional latent embedding, BiDiLEL)[53]、相关知识迁移(relational knowledge transfer, RKT)[54]、生成分类器(synthesized classifiers, SYNC)[49]以及局部敏感的流形保持方法[55]。

基于流形结构的零样本学习方法[49],如图8所示,能够考虑到类别间的关联关系,但不同特征空间的流形结构存在异构性,通常难以迁移。

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

图8 基于流形结构的零样本学习
Fig.8 Manifold structure based zero-shot learning

(4) 基于生成式模型的方法

最近一些研究基于生成样本的思想,借助于生成式网络,经训练集训练,在新类别上生成图像特征样本甚至原始二维图像,将零样本学习转化为监督学习分类问题加以解决。典型方法包括未知类别样本生成(unseen visual data synthesis, UVDS)[56]、ZSL对抗生成式方法(generative adversarial approach for ZSL, GAZSL)[57]、特征生成网络(feature generating networks, FGN)[58]、ZSL样本生成方法(synthesized examples ZSL, SE-ZSL)[59]、保留语义的对抗式嵌入网络(semantics-preserving adversarial embedding networks, SP-AEN)[60]等。

基于生成式模型的方法[61],如图9所示。

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

图9 基于生成式模型的零样本学习
Fig.9 Generative model based zero-shot learning

该方法通常分为样本生成和分类器训练两部分。在样本生成阶段,基于训练样本及其对应的文本描述信息,在新类别文本描述向量条件下,生成新类别的图像样本。在分类器训练阶段,基于生成的样本训练分类器并对测试样本进行在线识别。基于生成式模型的方法分步进行,易于追溯,但同样存在生成样本代表性不高、模型训练困难等问题。

2.3 实验设计

(1) 数据集及实验设置

当前零样本学习研究中常用的数据集包括动物属性标记(animals with attributes， AWA)[62]数据集、CUB(CUB-200-2011)[63]以及ImageNet 2010[64]等。表5详细列出了这些数据集统计信息以及在零样本学习中的固定测试集/训练集类别数划分。

表5 零样本学习常用数据集
Table 5 Data sets for zero-shot learning

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

关于类别描述特征向量,AWA和CUB数据集分别包含85维和312维的类别属性描述向量(Attributes),对于ImageNet 2010大型数据集,当前研究多采用大规模无标签文本训练词向量(Word Embedding)的方式,为每个类别生成高维的词向量表征[49]。

值得注意的是,在零样本学习中,由于缺少大量标签数据训练图像特征提取网络,当前研究中,图像特征通常采用预训练的CNN图像特征,即调用在miniImageNet数据集上预训练的CNN模型,在训练集/测试集图像上直接提取特征,常用的预训练模型包括GoogLeNet[65]以及VGGNet[66]等。

零样本学习中,训练集和测试集类别不同,在训练集上训练模型,在测试集类别中进行性能评估,通常采用分类任务,以分类准确率作为模型评估指标。

(2) 典型方法性能对比

表6列出了零样本学习领域当前几种典型模型的分类性能对比。可以看出,在仅有新类别语义特征描述的情况下,模型能够实现新概念识别分类,在AWA数据集10分类问题上取得了高达约90%的准确率,在CUB数据集50分类问题上取得了高达60%的准确率,甚至在ImageNet大型数据集200分类问题上取得了超过60%的Top 5准确率。与小样本学习类似,不同方法不仅模型设计思想不同,而且底层图像特征提取器结构也有所不同,因此各方法之间存在较大性能差异。

表6 几种典型零样本学习模型的分类性能对比
Table 6 Classification performance comparisons of the several typical models for zero-shot learning

3 零-小样本学习

与小样本学习和零样本学习类似,零-小样本学习借助于通用的类别特征描述,在少量支持样本条件下实现对新类别或概念的识别,本节首先给出明确问题描述,其次介绍当前的研究现状,最后介绍具体的实验设计和部分基准结果。

3.1 问题描述

给定由Ns个训练样本构成的训练集

其中,

是第i个样本图像,

是其类别标签,Cs是训练集标签集合,

是类别

对应的类别特征描述向量。Ds通常由大量训练样本构成。

基于上述训练集,零-小样本学习旨在分类识别新类别样本。在测试阶段,对于每一个新类别提供了少量支持样本

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

且所有的新类别的特征描述向量是已知的。对于给定的测试样本

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

零-小样本学习的任务是识别其类别标签

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

3.2 研究现状

为了更好地识别训练过程中未见过的新类别,一些学者在小样本学习的基础上增加类别属性特征描述向量,探索了文本信息辅助的小样本学习问题,即本文所述的零-小样本学习。

文献[47]最早提出融合零样本学习和小样本学习是提高机器智能的有效途径。之后,零-小样本学习问题逐渐被关注[56],并且出现了初步的研究工作。其中,文献[48]设计了多注意力网络,借助语义特征描述,利用图像局部特征,研究了语义信息辅助的小样本学习。基于生成式模型的思想,文献[47]提出对偶三角网络,基于类别语义信息生成新的样本特征;文献[70]在变分自编码器模型中增加多模态交叉配准损失函数,在新的隐特征空间中生成更多新样本,提出跨模态分布式变分自编码器(cross-modal and distribution aligned variational autoencoder, CADA-VAE), 实现了零-小样本条件下的数据增强。尽管出现了很长时间,但零-小样本学习领域尚未被充分研究。以上部分工作仍然依赖于预训练的CNN图像特征,在一些特定领域内,标签数据有限,难以开展预训练工作,这些方法的可行性较差。

值得一提的是,最近的研究工作[71]为零-小样本学习提供了有益探索。自适应模态混合机制(adaptive modality mixture mechanism, AM3)模型如图10所示。

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

图10 零-小样本学习模型(AM3)
Fig.10 Model (AM3) for zero-to-few shot learning

包含图像流和文本流两条路径,上部分表示图像信息流,下部分表示文本信息流,通过可自适应调整的权重因子加权,形成最终的类别原型。该模型提出了多模态信息自适应利用机制,可以在文本特征和图像特征中自适应调节权重因子,借助于跨模态信息来增强小样本学习性能。

3.3 实验设计

(1) 数据集及实验设置

当前零-小样本学习仍处于初始探索阶段,相关的研究十分有限。在零-小样本学习中,除了若干新类别支持样本外,还需要额外的类别语义特征描述向量作为辅助信息。当前研究主要是在miniImageNet[6]以及tieredImageNet[72]数据集上展开,其类别语义信息是通过预训练词向量提取得到的。

与小样本学习类似,零-小样本学习也采用表1所列的元学习训练范式。在训练阶段,通过已知类别的训练样本图像、类别标签以及类别描述向量训练模型参数。在测试阶段,在少量新类别支持样本及其类别描述向量信息辅助下,对大量测试样本进行分类识别,并统计识别正确率,作为最终的模型评价指标。当前常用的实验设置为5-way 1/5-shot 图像分类子任务。

(2) 典型方法性能对比

表7列出了零-小样本学习典型方法的分类性能。可以看出,在语义特征信息辅助下,仅提供1个支持样本就可以在miniImageNet数据集上取得65%的识别率。除各方法使用的图像特征提取器结构不同之外,值得一提的是,DeViSE, 鲁棒半监督视觉语义嵌入(robust semi-supervised visual-semantic embeddings, ReViSE)以及CADA-VAE模型使用了预训练的CNN图像特征,而AM3系列方法是端到端的模型参数训练,无需使用预训练图像特征。

表7 几种典型零-小样本学习模型在miniImagenet及tieredImageNet数据集上的分类性能
Table 7 Classification performance evaluations of the several typical models for zero-to-few-shot learning on the data sets of miniImagenet and tieredImageNet

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

4 未来研究方向

4.1 多种弱监督学习方法融合发展

当前弱监督机器学习研究主要集中在零样本学习以及小样本学习上,而对于文本信息辅助的零-小样本学习研究还很薄弱。零-小样本学习既包含了少量支持样本,同时又融合了文本信息,具备跨模态学习的独特优势,相对于零样本学习和小样本学习,性能获得了显著提升[71,73]。从人类认知角度看,人类识别新类别或者新概念会通过少数样本归纳总结,同时结合多种认知模式进行综合理解,如“未见其人,先闻其声”“字如其人”等都是多种认知模式综合作用的结果。综合实际需求和学术研究,零-小样本学习将是弱监督学习和人类认知结合的重要研究方向。

除此之外,零样本学习可以和主动学习相结合,提升主动学习效果。零样本学习可以融入到终身学习系统中,在仅有相关信息描述的情况下,持续学习新的任务。当前,强化学习迅速发展,结合弱监督机器学习,强化学习系统可以更好地应对新任务、新场景，甚至新领域。

4.2 弱监督机器学习的理论基础探究

当前,弱监督机器学习领域内研究大多在统一数据集下展开,甚至训练集/测试集的划分都是固定的。如零样本学习实验中,绝大多数研究在AWA数据集采用固定40类训练,指定10类测试;在CUB上固定150类训练,指定50类测试。实验数据相对固定,在这种数据设置下训练的模型在其他数据上的有效性,即模型的泛化能力值得考究。可考虑使用传统大规模数据集训练的有效方式,如5折交叉验证等方式来进行弱监督机器学习实验验证,充分测试模型在多种数据条件下的综合性能。

同时,实验设置应当更加切合实际应用,如当前小样本和零样本学习大多只在未见过的新类别上进行分类性能测试,然而在实际应用中,往往测试样本来源于新类别以及训练集中的类别,如何提升这种广义分类问题上的性能也是重要的研究方向。

另一方面,尽管零样本和小样本学习对于训练数据的数目要求很低,但是前期的模型预训练直接影响其最终性能,当前大多数模型繁琐复杂,如何在保证正确率的前提下,尽量降低模型复杂度也是非常值得研究的工作。

当前的研究主要是启发式探索和验证性实验,缺乏足够的理论基础,对于一些关键问题需要开展更多的理论分析,如零样本学习中如何选择辅助性信息,从训练集向未见过的测试样本迁移过程中,什么信息和知识更有效,在学习过程中,如何抑制不相关信息,避免负向迁移等。科学的理论分析和充足的实验证明将更有益于弱监督机器学习发展。

4.3 弱监督机器学习在其他领域任务上的应用

当前的弱监督机器学习研究主要集中在计算机视觉领域,包括字符识别、图像分类等。这主要得益于视觉信息易于获取,且在传统深度学习领域已有大量研究,很多成熟的技术可直接迁移到弱监督学习中来。当前针对几个主流的实验数据集,如miniImageNet等,已经取得了很高的识别率,性能提升空间很小。因此,应当开发更广泛的任务应用,如图像检索、目标跟踪、手势识别、图像标注、视觉问答、视频事件检测等。例如,如何将从粗粒度的动物分类任务中学习到的知识迁移到细粒度的狗品种分类任务中去。另外,应当从多种数据源获取大规模度多样化数据集,设置更加切近现实应用的实验基准。

除了计算机视觉,弱监督机器学习应当逐步扩展到其他领域。在自然语言处理中,可针对文本翻译、语言建模等开展研究;在推荐系统方面,依据少量样本进行相关推荐是一个值得研究的课题;在医学研究中,罕见药品发现将为医药研制提供创新途径。尤其是在机器人控制领域,依靠少量人工指导甚至依靠传统经验进行增强学习的智能学习方法将为机器人复杂运动规划与控制提供有效途径,当前典型的应用包括小样本模仿学习、视觉导航、机器人运动连续控制等。

5 结束语

本文从弱监督机器学习方法入手,主要介绍了小样本学习、零样本学习的问题定义，当前主流方法以及实验设计方案,之后给出了零-小样本学习问题描述及当前研究现状,最后对下一步研究方向进行了总结展望。

审核编辑：符乾江

阅读全文

机器学习(130422) 机器学习(130422)
大数据(136504) 大数据(136504)
深度学习(119795) 深度学习(119795)

机器学习基础知识全攻略

有监督学习通常是利用带有专家标注的标签的训练数据，学习一个从输入变量X到输入变量Y的函数映射。Y = f (X)，训练数据通常是(n×x,y)的形式，其中n代表训练样本的大小，x和y分别是变量X和Y的样本值。

2024-02-25 13:53:17

OpenAI推出Sora：AI领域的革命性突破

大模型的核心技术是自然语言处理（NLP）和深度学习。具体而言，它基于Transformer架构，使用了大规模无监督学习方法，例如自回归语言建模和掩码语言建模，来训练一个庞大的神经网络模型。

2024-02-21 16:36:29

713

良品学习在高良率制造业中缺陷检测的应用

缺陷形态多变，还可能出现各种无法预测的异常情况，传统的缺陷模拟方法往往难以应对，这无疑增加了检测的成本和难度。良品学习阿丘科技的良品学习模式，拥有非监督分类与非监

2024-01-26 08:25:10

155

请问初学者要怎么快速掌握FPGA的学习方法?

对于初学者 FPGA的编程语言是什么? FPGA芯片的基础结构也不了解. FPGA开发工具的名称和使用方法都不知道. 要学的很多啊,请问有什么自学的学习方法么?

2024-01-02 23:01:00

主流的深度学习模型有哪些？AI开发工程师必备！

更接近于人工智能。它通过学习样本数据的内在规律和表示层次，对文字、图像和声音等数据进行解释。深度学习的目标是让机器像人一样具有分析学习能力，能够识别文字、图像和声音等数

2023-12-29 08:26:33

571

新技术在生物样本冷冻中的应用案例分析

、生物分子等提供了重要的实验手段。　　新技术在生物样液氮罐本冷冻中的应用案例分析表明，这些创新方法为生物学研究提供了更高效、可靠和经济的样本处理解决方案。低温离心、冷冻探头技术和冷冻显微镜技术等

2023-12-26 13:30:34

异构信号驱动下小样本跨域轴承故障诊断的GMAML算法

论文提出了一种通用的模型不可知元学习（GMAML）方法，用于在异质信号驱动的不同工况下，进行轴承的少样本故障诊断。

2023-12-06 15:07:41

528

基于transformer和自监督学习的路面异常检测方法分享

铺设异常检测可以帮助减少数据存储、传输、标记和处理的压力。本论文描述了一种基于Transformer和自监督学习的新方法，有助于定位异常区域。

2023-12-06 14:57:10

656

无监督域自适应场景：基于检索增强的情境学习实现知识迁移

本文对比了多种基线方法，包括无监督域自适应的传统方法（如Pseudo-labeling和对抗训练）、基于检索的LM方法（如REALM和RAG）和情境学习方法（如In-context learning）。

2023-12-05 14:14:08

161

学习台灯|AI摄像头学习机_支持视频通话方案

　　学习台灯是一款专为学生设计的智能学习助手，具备多项功能和特点，旨在提供安全、便捷的学习环境。该台灯不仅无视闪光和蓝光危害，还能通过语音回答学习过程中的各种问题，让学生能够及时得到解答。

2023-11-28 18:26:29

3.GraphSAGE[9]：generalized aggregation方法

归纳学习（Inductive Learning）：先从训练样本中学习到一定的模式，然后利用其对测试样本进行预测（即首先从特殊到一般，然后再从一般到特殊），这类模型如常见的贝叶斯模型。在GAT中

2023-11-16 10:38:09

221

求助,有什么学习汇编语言的速成好方法吗？

有什么学习汇编语言的速成好方法吗？

2023-11-03 07:32:18

全面总结机器学习中的优化算法

几乎所有的机器学习算法最后都归结为求一个目标函数的极值，即最优化问题，例如对于有监督学习，我们要找到一个最佳的映射函数f (x)，使得对训练样本的损失函数最小化（最小化经验风险或结构风险）。

2023-11-02 10:18:52

231

什么是强化学习

强化学习是机器学习的方式之一，它与监督学习、无监督学习并列，是三种机器学习训练方法之一。在围棋上击败世界第一李世石的 AlphaGo、在《星际争霸2》中以 10：1 击败了人类顶级职业玩家

2023-10-30 11:36:40

1042

stm32学习方法及资料

1、一共 24 个库，不可能都学，都学也没用。按照我的工作需求必须学的有 16 个，这 16 个也不是全学。主要学习来源是各种例程代码、“固件函数库用户手册”和“参考手册”。具体学习方法是通读

2023-10-13 06:30:28

机器学习的采样方法有哪些？

我们可以选择在整个人口中随机抽取一个 60 大小的样本，但在这些城镇中，随机样本可能不太平衡，因此会产生偏差，导致估计误差很大。　　相反，如果我们选择从 A、B 和 C 镇分别抽取 10、20 和 30 个随机样本，那么我们可以在总样本大小相同的情况下，产生较小的估计误差。

2023-10-11 09:20:40

104

深度学习的由来深度学习的经典算法有哪些

深度学习作为机器学习的一个分支，其学习方法可以分为监督学习和无监督学习。两种方法都具有其独特的学习模型：多层感知机、卷积神经网络等属于监 督学习；深度置信网、自动编码器、去噪自动编码器、稀疏编码等属于无监督学习。

2023-10-09 10:23:42

301

《电子工程师必备——九大系统电路识图宝典》+附录5学习方法

jf_39110170 网名“还没吃饭”阅读《电子工程师必备九大系统电路识图宝典第2版》附录5的读后感：探索科学学习方法 作为一名对电子技术学科充满热情的嵌入式工程师，你是否曾因学习方法的不明确而感到困惑？你是否曾在

2023-10-06 23:25:22

STM32的学习方法

STM32学习方法

2023-09-28 06:18:03

机器学习与数据挖掘方法和应用

机器学习与数据挖掘方法和应用（经典）

2023-09-26 07:56:49

ICML 2023 | 对多重图进行解耦的表示学习方法

Introduction 无监督多重图表示学习（UMGRL）受到越来越多的关注，但很少有工作同时关注共同信息和私有信息的提取。在本文中，我们认为，为了进行有效和鲁棒的 UMGRL，提取完整和干净

2023-09-24 20:45:03

587

使用LabVIEW调用IR模型解薛定谔方程

基于物理信息的神经网络（Physics-informed Neural Network，简称PINN），是一类用于解决有监督学习任务的神经网络，它不仅能够像传统神经网络一样学习到训练数据样本的分布

2023-09-24 15:36:11

476

什么是零样本学习？为什么要搞零样本学习？

零样本分类的技术目前正处于高速发展时期，所涉及的具体应用已经从最初的图像分类任务扩展到了其他计算机视觉任务乃至自然语言处理等多个相关领域。对此，本文将其称为广义零样本分类。相应地，我们将针对图像分类任务的零样本分类任务称为狭义零样本分类。

2023-09-22 11:10:25

793

梳理单片机学习方法、产品开发流程

梳理单片机学习方法、产品开发流程

2023-09-21 17:20:07

361

基于机器学习的车位状态预测方法

本发明公开一种基于机器学习的车位状态预测方法，基于历史数据，建立回归决策树模型进而构建改进决策树模型，对每个区域的停车率进行预测，基于停车率和用户喜好度为用户推荐相应的停车区域，获取相应停车区域

2023-09-21 07:24:58

Sentry ND网络防御：实时无监督机器学习解决方案

电子发烧友网站提供《Sentry ND网络防御：实时无监督机器学习解决方案.pdf》资料免费下载

2023-09-13 10:19:21

统计学习方法代码集

统计学习所含部分代码合集

2023-09-07 09:24:21

一文详解机器学习和深度学习的区别

深度学习这几年特别火，就像5年前的大数据一样，不过深度学习其主要还是属于机器学习的范畴领域内，所以这篇文章里面我们来唠一唠机器学习和深度学习的算法流程区别。

2023-09-06 12:48:40

1174

机器学习模型类型分类

。Y = f (X)，训练数据通常是(n×x,y)的形式，其中n代表训练样本的大小，x和y分别是变量X和Y的样本值。有监督学习可以被分为两类：分类问题：预测某一样本所属的类别（离散的）。比如判断性别，是否健康等。回归问题：预测某一样本的所对应的实数输出（连续的）。

2023-09-05 11:45:06

1159

TUM&谷歌提出md4all：挑战性条件下的单目深度估计

在这些情况下, 传感器自带的噪声、无纹理的黑暗区域和反光等不利因素都违反了基于监督和自监督学习方法的训练假设。自监督方法无法建立学习深度所需的像素的对应关系，而监督方法则可能从传感器真值中（如上图中的 LiDAR 与 nuScenes 的数据样本）中学习到数据瑕疵。

2023-09-04 16:14:20

334

适用于任意数据模态的自监督学习数据增强技术

模态的。这意味着需要为不同的数据模态开发不同的自监督学习算法。为此，本文提出了一种通用的数据增强技术，可以应用于任意数据模态。相较于已有的通用的自监督学习，该方法能够取得明显的性能提升，同时能够代替一系列为特

2023-09-04 10:07:04

738

NUC240_FreeRTOS修改BSP样本代码

修改 BSP 样本代码, 以在 FreeRTOS 下工作。 FreeRTOS 是一个实时操作系统。样本代码设定了执行进程样本代码的两项任务。您可以在下列时间下载样本代码http://www.nuvoton.com/resources-downlo.0703103847 nuvoton 核

2023-08-31 10:05:24

NANO100_FreeRTOS修改BSP样本代码

NANO100_FreeRTOS 修改 BSP 样本代码, 以在 FreeRTOS 下工作。 FreeRTOS 是一个实时操作系统。样本代码设定了执行进程样本代码的两项任务。您可以在下列时间下载样本代码http://www.nuvoton.com/resources-downlo.0402180555 nuvoton 核

2023-08-31 06:30:38

如何使用机器学习在M480上执行关键字识别

应用程序: 本样本代码使用机器学习来在 M480 上执行关键字识别。 BSP 版本: M480系列 BSP CMSIS V3.04.000 硬件: NuMaker-PFM-M487 VER 3.0

2023-08-29 06:46:22

机器学习和深度学习的区别

　　机器学习和深度学习是当今最流行的人工智能(AI)技术之一。这两种技术都有助于在不需要人类干预的情况下让计算机自主学习和改进预测模型。本文将探讨机器学习和深度学习的概念以及二者之间的区别。

2023-08-28 17:31:09

885

人工智能的关键技术包括哪些

机器学习是人工智能的一个重要分支，它通过计算的手段、学习经验（也可以说是利用经验）来改善系统的性能。它包括：有监督学习、无监督学习和强化学习。

2023-08-28 12:53:08

931

实施4条线阻塞触摸板控制的NUC126样本代码

应用:这一基于NUC126的样本代码,用于实施4条线阻塞触摸板的控制。 BSP 版本: NUC126系列 BSP CMSIS v3.00.003 硬件:NuTiny-NUC126 目前市场上有4条

2023-08-23 06:37:54

使用快速Fourier变换法将ADC样本转换为频域频谱的方法和结果

应用:展示使用快速Fourier变换法将ADC样本转换为频域频谱的方法和结果。 BSP 版本: NUC121/125系列 BSP CMSIS V3.01.003 硬件

2023-08-22 08:13:00

使用机器学习在M480上执行关键字识别

应用程序: 本样本代码使用机器学习来在 M480 上执行关键字识别。 BSP 版本: M480系列 BSP CMSIS V3.04.000 硬件: NuMaker-PFM-M487 VER 3.0

2023-08-22 08:02:00

深度学习和机器学习的定义和优缺点深度学习和机器学习的区别

　　深度学习和机器学习是机器学习领域中两个重要的概念，都是人工智能领域非常热门的技术。两者的关系十分密切，然而又存在一定的区别。下面从定义、优缺点和区别方面一一阐述。

2023-08-21 18:27:15

1633

计算机视觉中的九种深度学习技术

计算机视觉中仍有许多具有挑战性的问题需要解决。然而，深度学习方法正在针对某些特定问题取得最新成果。在最基本的问题上，最有趣的不仅仅是深度学习模型的表现;事实上，单个模型可以从图像中学习意义并执行视觉任务，从而无需使用专门的手工制作方法。

2023-08-21 09:56:05

306

机器学习有哪些算法？机器学习分类算法有哪些？机器学习预判有哪些算法？

有许多不同的类型和应用。根据机器学习的任务类型，可以将其分为几种不同的算法类型。本文将介绍机器学习的算法类型以及分类算法和预测算法。机器学习的算法类型 1. 监督学习算法在监督学习算法中，已知标记数据和相应的输出

2023-08-17 16:30:11

1243

机器学习是什么意思？机器学习属于什么分支？机器学习有什么用处？

机器学习是什么意思？机器学习属于什么分支？机器学习是什么有什么用处？机器学习是指让计算机通过经验来不断优化和改进自身的算法和模型的过程。因此，机器学习可以被理解为是一种从数据中自动获取规律和知识

2023-08-17 16:30:04

1143

机器学习算法入门机器学习算法介绍机器学习算法对比

机器学习算法入门机器学习算法介绍机器学习算法对比机器学习算法入门、介绍和对比随着机器学习的普及，越来越多的人想要了解和学习机器学习算法。在这篇文章中，我们将会简单介绍机器学习算法的基本概念

2023-08-17 16:27:15

568

机器学习算法总结机器学习算法是什么机器学习算法优缺点

机器学习算法总结机器学习算法是什么?机器学习算法优缺点? 机器学习算法总结机器学习算法是一种能够从数据中自动学习的算法。它能够从训练数据中学习特征，进而对未知数据进行分类、回归、聚类等任务。通过

2023-08-17 16:11:50

937

机器学习算法汇总机器学习算法分类机器学习算法模型

机器学习算法汇总机器学习算法分类机器学习算法模型机器学习是人工智能的分支之一，它通过分析和识别数据模式，学习从中提取规律，并用于未来的决策和预测。在机器学习中，算法是最基本的组成部分之一。算法

2023-08-17 16:11:48

632

机器学习算法的5种基本算子

自主决策的方法和插件，其中包含了一系列常用的基本算子。在本文中，我们将会介绍机器学习算法的五种基本算子。一、求值算子求值算子是常用的机器学习算法中的一个基本元素，它通常用于对输入数据进行处理。在数据分析和处

2023-08-17 16:11:46

1244

机器学习和深度学习的区别

的区别。 1. 机器学习机器学习是指通过数据使机器能够自动地学习和改进性能的算法。机器学习是人工智能的一个重要分支，它通过一系列的训练样本，让机器从数据中学习规律，从而得出预测或决策。机器学习算法可以分为有监督学习

2023-08-17 16:11:40

2718

机器学习可以分为哪几类？机器学习技术有哪些？

机器学习可以分为哪几类？机器学习技术有哪些机器学习（Machine Learning，ML）是一种通过自动化自我学习所增强的能力，从数据中获取知识的方法。可以说，机器学习是在人工智能的支持下

2023-08-17 16:11:36

4056

深度学习框架和深度学习算法教程

了基于神经网络的机器学习方法。深度学习算法可以分为两大类：监督学习和无监督学习。监督学习的基本任务是训练模型去学习输入数据的特征和其对应的标签，然后用于新数据的预测。而无监督学习通常用于聚类、降维和生成模型等任务中

2023-08-17 16:11:26

637

深度学习算法库框架学习

深度学习算法库框架学习深度学习是一种非常强大的机器学习方法，它可以用于许多不同的应用程序，例如计算机视觉、语言处理和自然语言处理。然而，实现深度学习技术需要使用一些算法库框架。在本文中，我们将探讨

2023-08-17 16:11:07

411

深度学习框架是什么？深度学习框架有哪些？

深度学习框架是什么？深度学习框架有哪些？深度学习框架是一种软件工具，它可以帮助开发者轻松快速地构建和训练深度神经网络模型。与手动编写代码相比，深度学习框架可以大大减少开发和调试的时间和精力，并提

2023-08-17 16:03:09

1585

什么是深度学习算法？深度学习算法的应用

什么是深度学习算法？深度学习算法的应用深度学习算法被认为是人工智能的核心，它是一种模仿人类大脑神经元的计算模型。深度学习是机器学习的一种变体，主要通过变换各种架构来对大量数据进行学习以及分类处理

2023-08-17 16:03:04

1299

深度学习算法简介深度学习算法是什么深度学习算法有哪些

深度学习算法简介深度学习算法是什么?深度学习算法有哪些? 作为一种现代化、前沿化的技术，深度学习已经在很多领域得到了广泛的应用，其能够不断地从数据中提取最基本的特征，从而对大量的信息进行机器学习

2023-08-17 16:02:56

5989

工业产品表面缺陷检测方法研究

制造业的全面智能化发展对工业产品的质量检测提出了新的要求。本文总结了机器学习方法在表面缺陷检测中的研究现状，表面缺陷检测是工业产品质量检测的关键部分。首先，根据表面特征的用途，从纹理特征、颜色特征

2023-08-17 11:23:29

529

人工智能技术包括哪些方面

机器学习通常分为监督学习和无监督学习。 监督学习通过在计算机上显示标记的数据集进行训练，使其可以预测未来的输入。无监督学习则是一种不需要标记数据的学习方式，计算机需要在不同的输入中发现模式。

2023-08-14 15:06:21

1132

人工智能ai是什么

在人工智能的发展中，最重要的是机器学习（Machine Learning），这是一种人工智能的实现方式，通过对大量数据进行分析和学习，让系统自己找到规律和特征，从而达到自主智能化的目的。在机器学习中，主要有三种方式，分别是监督学习、非监督学习和半监督学习。

2023-08-14 14:20:58

2408

人工智能的关键技术是什么?

机器学习是AI的核心技术之一，也是训练计算机识别和理解数据的方法。机器学习涉及大量的数据处理和分析，以便学习能够从这些数据中发现规律和模式。机器学习可以被分为三个主要类别，分别是监督学习、无监督学习和强化学习。

2023-08-13 09:24:35

1591

人工智能如何学习

的问题。在下面的文章中，我们将探讨AI学习的过程和方法。 AI学习的过程：在AI中，学习类似于人类学习的过程。由于AI随着时间的推移而不断改进和改变，因此AI的学习过程比人类快得多。因此，许多研究人员在尝试了解AI学习过程的各个方

2023-08-12 16:44:15

688

机器学习和深度学习的区别

　　机器学习是一种方法，利用算法来让机器可以自我学习和适应，而且不需要明确地编程。在许多应用中，需要机器使用历史数据训练模型，然后使用该模型来对新数据进行预测或分类

2023-08-02 17:36:34

332

基于深度学习的点云分割的方法介绍

基于视图和投影的方法、基于体素的方法、无序点云的方法、有序点云的方法以及无监督学习的方法，并简要评述；最后分析各类方法优劣并展望未来研究趋势。

2023-07-20 15:23:59

单样本微调给ChatGLM2注入知识

LoRA微调是一种高效的融入学习算法。类似人类把新知识融入现有知识体系的学习过程。学习时无需新知识特别多的样本，学习后原有的庞大知识和能力可以基本不受影响。

2023-07-18 14:44:39

2541

两类常用集成学习方法#机器学习

机器学习

未来加油dz发布于 2023-07-14 16:04:14

联合学习在传统机器学习方法中的应用

联合学习在传统机器学习方法中的应用

2023-07-05 16:30:28

489

如何在缺陷样本少的情况下实现高精度的检测

样本少的情况下实现高精度的检测呢？目前有两种方法，一种是小样本学习，另一种是用GAN。本文将介绍一种GAN用于无缺陷样本产品表面缺陷检测。深度学习在计算机视觉主流领域已经应用的很成熟，但是在工业领域，比如产品表面缺

2023-06-26 09:54:04

688

基于GAN的零缺陷样本产品表面缺陷检测

少的情况下实现高精度的检测呢？目前有两种方法，一种是小样本学习，另一种是用GAN。本文将介绍一种GAN用于无缺陷样本产品表面缺陷检测。

2023-06-26 09:49:01

549

一个通用的时空预测学习框架

，实现了高效的视频预测。引言时空预测学习是一种通过学习历史帧来预测未来帧的自监督学习范式，可以利用海量的无标注视频数据学习丰富的视觉信息，在气象预测

2023-06-19 10:27:39

886

从浅层到深层神经网络：概览深度学习优化算法

优化算法一直以来是机器学习能根据数据学到知识的核心技术。而好的优化算法可以大大提高学习速度，加快算法的收敛速度和效果。该论文从浅层模型到深度模型纵览监督学习中常用的优化算法，并指出了每一种优化算法

2023-06-15 11:20:22

395

小样本学习领域的未来发展方向

什么是小样本学习？它与弱监督学习等问题有何差异？其核心问题是什么？来自港科大和第四范式的这篇综述论文提供了解答。数据是机器学习领域的重要资源，在数据缺少的情况下如何训练模型呢？小样本学习是其中

2023-06-14 09:59:27

564

亿图AI × 学习，终身学习的效率加速器

“学习型组织之父”彼得·圣吉在《第五项修炼：终身学习者》中提到，我们所有的学习都涉及我们如何与世界交往互动，而学习所带来的实践将影响我们如何创造未来。学习的重要性不言而喻。无论是十年寒窗、学术研究

2023-06-08 11:28:17

346

自动驾驶中的机器学习

在自动驾驶技术中的应用。为了让读者更好地理解自动驾驶中的机器学习算法，本文会首先介绍有关该设备和自动驾驶技术的运行原理，然后介绍机器学习方法及其在自动驾驶任务中的应用。最后展示一些流行的自动驾驶技术模拟器。

2023-06-06 10:06:15

学习学习点亮数码管

你好！最近想学习学习点亮多段位数码管，谢谢版主

2023-06-03 21:14:41

一个通用的自适应prompt方法，突破了零样本学习的瓶颈

为了解决这个问题，这篇研究提出了一种Universal Self-adaptive Prompting (USP)方法，对LLMs的零样本学习进行了优化，同时也适用于少样本学习任务。USP只需要少量

2023-06-01 14:48:01

459

机器学习笔记之优化-拉格朗日乘子法和对偶分解

优化是机器学习中的关键步骤。在这个机器学习系列中，我们将简要介绍优化问题，然后探讨两种特定的优化方法，即拉格朗日乘子和对偶分解。这两种方法在机器学习、强化学习和图模型中非常流行。

2023-05-30 16:47:17

1333

人工智能领域的梯度学习研究

前向梯度学习通常用于计算含有噪声的方向梯度，是一种符合生物学机制、可替代反向传播的深度神经网络学习方法。然而，当要学习的参数量很大时，标准的前向梯度算法会出现较大的方差。

2023-05-30 10:34:07

191

浅谈人工智能、机器学习对智能革命的意义

深度学习的意思其实不是不变的，它的本意是动态发展的。最初的深度学习基本意思是聚焦于区别于误差反向传递算法（Backpropogation）那种打包式的黑箱（black-box）学习方法。

2023-05-30 10:14:06

261

精通机器学习之MATLAB分步实施指南

本电子书建立在使用 MATLAB 进行机器学习的基础上，后者回顾了机器学习基础知识，并介绍了监督和无监督学习的技术方法。我们使用心音分类器为例，向您介绍真实世界中的机器学习应用程序

2023-05-29 09:14:53

康耐视深度学习实现高效血清质量检测

本期就为大家详细介绍一则康耐视深度学习技术，在样品前处理以及血液检测仪器上所涉及到的血清质量检测应用案例。当异常血液样本（黄疸、溶血、脂血）等不良血液误入到正常样本测试中，可能会出现污染检测物，堵针等问题。通过使用康耐视深度学习技术进行相关测试与分析，可以有效解决这些问题。

2023-05-26 16:21:46

549

基于深度学习的散射成像研究进展

卷积神经网络（CNN）是一种用于对目标进行重建、分类等处理的深度学习方法。自2016年深度学习被首次应用于散射成像，该研究一直是光学成像领域的热门方向。

2023-05-24 09:51:21

166

联邦学习在边缘计算中的应用

什么是联邦学习？联邦学习（Federated Learning）是一种分布式机器学习技术，其核心思想是通过在多个拥有本地数据的数据源之间进行分布式模型训练，在不需要交换本地个体或样本

2023-05-18 15:52:21

深度学习边缘计算综述论文阅读笔记

这是一篇关于深度学习和边缘计算基础知识的综述，包含了深度学习DL的几种网络模型的介绍，边缘计算的基础知识的介绍，以及二者的结合，如何利用DL来发展边缘计算，如何用边缘计算发展DL,怎么在边缘计算

2023-05-18 14:36:25

通过弱监督学习揭示医学影像中的秘密

将医学影像交给人工智能 (AI) 来分析，可以比人类专家更快、更准确地检测和测量出异常情况，推动基于影像的医疗诊断更进一步发展。要借此来改善患者的治疗效果并确立针对性的治疗方法，就必须建立起在不同人

2023-05-18 09:57:27

567

最新3D表征自监督学习+对比学习：FAC

第二个是我们防止 3D 片段/对象之间的过度判别，并通过 Siamese 对应网络中的自适应特征学习鼓励片段级别的前景到背景的区别，该网络有效地自适应地学习点云视图内和点云视图之间的特征相关性。

2023-05-17 09:28:17

530

机器学习相关介绍：支持向量机(低维到高维的映射)

根据机器学习相关介绍(9)——支持向量机(线性不可分情况)，通过引入松弛变量δi将支持向量机推广至解决非线性可分训练样本分类的方式不能解决所有非线性可分训练样本的分类问题。因此，支持向量机的可选函数范围需被扩展以提升其解决非线性可分训练样本分类问题的能力。

2023-05-16 11:20:26

1250

机器学习步骤详解，一文了解全过程

调整，使其生成正确的输出。在其他情况下，则实行无监督学习，由系统负责梳理数据来发现以前未知的模式。大多数机器学习模型都是遵循这两种范式（监督学习与无监督学习）。

2023-05-16 09:55:36

3598

GPU引领的深度学习

早期的机器学习以搜索为基础，主要依靠进行过一定优化的暴力方法。但是随着机器学习逐渐成熟，它开始专注于加速技术已经很成熟的统计方法和优化问题。同时深度学习的问世更是带来原本可能无法实现的优化方法。本文将介绍现代机器学习如何找到兼顾规模和速度的新方法。

2023-05-09 09:58:33

540

高效扩充样本库 | AIDG AI 样本生成器 2.0 焕新而来

高质量样本有利于快速构建理想的深度学习模型，然而在动力电池、3C电子、汽车制造等高良率的生产场景中，想要获取足够数量的缺陷样本用于AI品质检测，可能需要做出额外的努力。用图像处理软件制作缺陷样本

2023-05-08 09:41:18

921

悉尼大学最新综述：深度学习图像抠图

自深度学习出现之后，研究者设计出了多种多样的基于卷积神经网络的解决方案。和传统方法一样，早期的深度学习方法依然需要依赖一定量的人工辅助信息，例如三分图（trimap），涂抹（scribble），背景图像等等

2023-04-20 09:31:43

399

机器学习算法的分类

根据有无标签，监督学习可分类为：传统的监督学习（Traditional Supervised Learning）、非监督学习（Unsupervised Learning）、半监督学习（Semi-supervised Learning）。

2023-04-18 16:26:13

626

关于学习RISC-V的方法问题

最近看到很多人和论坛都在讨论RISC-V，怎么说也要赶上潮流吧，请问各位大佬，如果作为一名初学者，要学习RISC-V，有什么好的学习方法和资料推荐呢？谢谢。

2023-04-14 21:53:00

跨解剖域自适应对比半监督学习方法解析

在半监督学习中，一个典型的例子是 Mean-Teacher。与对抗网络类似，其整体架构包含了两个网络：teacher 网络和 student 网络。

2023-04-14 14:37:06

724

什么牌子的学习机好？选科大讯飞“黑科技”学习平板

随着人们对品质生活的追求，网上选购学习机越来越看重品牌价值了，那些大品牌学习平板越来越受到人们的追捧和信赖，不仅产品质量有保障而且更有面子。那么买什么牌子的学习机好？今天小编精心整理了科大讯飞学习

2023-04-13 15:53:52

1625

新手必看的机器学习的方法合集

机器学习的本质，其实就是模仿人类大脑进行学习的过程，通过让机器模仿这种学习过程实现所谓的“智能”。

2023-03-29 11:06:03

895

人工智能与机器学习、深度学习的区别

人工智能包含了机器学习和深度学习。你可以在图中看到，机器学习是人工智能的子集，深度学习是机器学习的子集。所以人工智能、机器学习和深度学习这三者的关系就像爷爷、父亲与儿子。

2023-03-29 11:04:10

1101

深度学习研究和应用发展,人工智能/机器学习/深度学习的关系

区别于人工智能，机器学习、尤其是监督学习则有更加明确的指代。机器学习是专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构，使之不断改善自身的性能。

2023-03-28 11:11:28

1077

语言模型性能评估必备下游数据集：ZeroCLUE/FewCLUE与Chinese_WPLC数据集

零样本学习是AI识别方法之一。简单来说就是识别从未见过的数据类别，即训练的分类器不仅仅能够识别出训练集中已有的数据类别，还可以对于来自未见过的类别的数据进行区分。小样本学习（Few-shot Learning）是解决在极少数据情况下的机器学习问题展开的评测。

2023-03-27 11:38:15

954

人工智能、机器学习、深度学习的关系

归纳：从具体案例中抽象一般规律，机器学习中的“训练”亦是如此。从一定数量的样本（已知模型输入X和模型输出Y）中，学习输出Y与输入X的关系（可以想象成是某种表达式）。

2023-03-27 11:10:44

7363

如何应用Anomalib在数据集不平衡的情况下检测缺陷？

基于监督式学习的方法利用足够的注释异常样本，通常可用于实现令人满意的异常检测结果。

2023-03-27 10:40:53

1137

已全部加载完成

搜索历史

融合零样本学习和小样本学习的弱监督学习方法综述

评论