什么是零样本学习？为什么要搞零样本学习？

网上有一些关于零样本学习的讨论，但都有其局限性，不全面或者太学术，我学习之后，对其进行加工，加上我自己的的理解，然后对后来想要了解零样本学习的同学，可能会有帮助，至少能节省点时间。相比于网上的各种五花八门的介绍，我争取做到更全面，更通俗。

为什么我开始研究零样本学习？是个巧合。之前我没听说过，上个学期，在一次组会上，听一个师姐做汇报，讲她关于小样本学习的研究。听了介绍，我瞬间被吸引，很感兴趣，但平时忙于上课，也一直没去深入了解，（懒）。直到前几天，在某文章里看到零样本学习，这次我有时间了！于是，就深入了解了下（看了几篇文献hhhh）。本人水平有限，难免疏漏，还请读者多多指正。

为什么要搞零样本学习？（why）

（1）深度学习（deep learning）已经在各个领域取得了广泛的应用，例如在图像分类问题下，其准确率目前可以达到不错的成绩。然而，deep learning是一种data hungry的技术，高的准确率建立在预先给模型“喂了”大量的数据，即，需要大量的标注样本才能发挥作用，大多数方法是通过有标签的训练集进行学习，侧重于对已经在训练中出现过标签类别的样本进行分类。然而在现实场景中，许多任务需要对模型之前从未见过的实例类别进行分类，这样就使得原有训练方法不再适用。因为，现实世界中，有很多问题是没有这么多的标注数据的，或者获取标注数据的成本非常大。所以，我们思考，当标注数据量比较少时、甚至样本为零时，还能不能继续？我们将这样的方法称为小样本学习Few-Shot Learning，相应的，如果只有一个标注样本，称One-Shot Learning，如果不对该类进行样本标注学习，就是零样本学习Zero-Shot Learning.（2）人类学习的过程包含了大量零样本学习的思路，也就是说一个小孩子从来没见过一些类别的东西，在家长和老师的描述之后，他也能在一堆图片里找出那件东西。

在2016 年中国计算机大会上，谭铁牛院士指出，生物启发的模式识别是一个非常值得关注的研究方向，“比如人识别一个动物（并不需要看到过该动物），只需要一句话的描述就能识别出来该动物”，比如被广泛引用的人类识别斑马的例子：假设一个人从来没有见过斑马这种动物，即斑马对这个人来说是未见类别，但他知道斑马是一种身上有着像熊猫一样的黑白颜色的、像老虎一样的条纹的、外形像马的动物，即熊猫、老虎、马是已见类别。那么当他第一次看到斑马的时候，可以通过先验知识和已见类，识别出这是斑马。人类通过语义知识作为辅助信息，识别了未见类，零样本学习也正是基于这样的思想、基于人类学习过程，进行算法的研究。

什么是零样本学习？（what）

零样本学习zero-shot learning，是最具挑战的机器识别方法之一。

定义：（数学描述在此略过）2019年冀中等人在综述文章中将零样本分类的定义分为广义和狭义两种：

零样本分类的技术目前正处于高速发展时期，所涉及的具体应用已经从最初的图像分类任务扩展到了其他计算机视觉任务乃至自然语言处理等多个相关领域。对此，本文将其称为广义零样本分类。相应地，我们将针对图像分类任务的零样本分类任务称为狭义零样本分类。

在冀中和 WEI WANG的文章中，零样本学习均被视为迁移学习的一个特例。零样本学习中，源特征空间是训练样本的特征空间和目标特征空间是测试样本的特征空间，这两者是相同的。但是源标注空间和目标标注空间分别是可见类别和未见类别，两者是不同的。因此零样本学习属于异质迁移学习（heterogeneous transfer learning）。一个最通俗的例子就是在本文第1部分里提得到的斑马的例子。

零样本学习的实现与另外两个研究领域密不可分，其一是表征学习（representation learning），其二是度量学习（metric learning）。表征学习是指通过对数据进行变换从而提取数据中的有效信息的一种学习方式，涉及到人工智能相关的诸多领域，如信号处理、目标识别、自然语言处理，以及迁移学习等。度量学习通常建立在表征学习的基础之上，其本质是根据不同的任务，根据特定空间中的数据，自主学习出针对某个特定任务的距离度量函数，目前已被广泛应用于诸多计算机视觉相关的任务，如人脸识别、图像检索、目标跟踪、多模态匹配等。对于零样本学习，在获取到合适的数据表征空间之后，则需要对跨模态样本间的距离度量进行学习，目的是保证嵌入到语义空间后样本间的语义相似度关系得以保持。综上所述，零样本学习可以看作是在进行表征学习和度量学习的基础上，通过借助辅助信息（属性或文本）实现跨模态知识的迁移，从而完成可见类信息到未见类信息推断的迁移学习过程。

之前的学者们都是怎么做的？（how）

Zero-Shot Learning 这一问题和概念的提出，源于2009年Lampert在CVPR上发表的Learning to Detect Unseen Object Class by Between-Class Attribute Transfer这一篇文章。同样是这一年，Hinton等在NIPS也上发表了一篇Zero Shot Learning with Semantic Output Codes的文章。这算得上零样本学习开宗明义的文章，所以先介绍这两篇。Lampert在论文中所提到的Between-Class Attribute Transfer，通常我们做有监督学习的思路，是实现数据的特征空间到数据标签之间的映射，而这里，我们利用数据特征预测的却是样本的某一属性。类间属性迁移应用到上文提到的斑马案例，见下图：

Between-Class Attribute Transfer的核心思想在于：

虽然物体的类别不同，但是物体间存在相同的属性，提炼出每一类别对应的属性并利用若干个学习器学习。在测试时对测试数据的属性预测，再将预测出的属性组合，对应到类别，实现对测试数据的类别预测。Lampert在该论文中给出了两种属性预测的结构：DAP和IAP。

直接属性预测 Direct attribute prediction （DAP）

这一方法先将数据从特征空间映射到中间层的属性向量层，属性向量层的标签是通过收集来的每一类特征的总结，比如是否有尾巴，有几只脚等等，通过利用数据预测属性，再通过属性映射到标签来实现对于未知类别的预测，这一方法也是接受和应用最为广泛的一种。

间接属性预测 Indirect attribute prediction （IAP）

这一方法使用了两层标签，属性层作为中间层，在实际中使用较少，这里不多做介绍

Hinton等在2009年的Zero-shot learning with semantic output codes这篇论文里，提到的语意输出编码方式，思想其实与DAP的思路类似，也是在之前的特征空间与标签之间增加了一层，这里增加的一层不再是数据本身的属性，而是标签本身的编码，说简单点就是NLP里面的词向量（word2vec），通过将标签进行词向量的编码，利用模型基于数据矩阵对编码进行预测，得到结果之后，通过衡量输出与各个类别词向量之间距离，判别样本的类别。

简单说就是，该论文里使用词向量来实现零样本学习。如果我们将原先的表示类别的词（马、熊猫、老虎等）编码为词向量，那么我们就可以用距离来衡量一个未知的词向量的归属。

语义输出编码的核心思想在于：

将训练标签编码为词向量，基于训练数据和词向量训练学习器。测试时输入测试数据，输出为预测的词向量，计算预测结果与未知类别词向量的距离，数据距离最近的类别。（所以未知类别的词向量在此是已知的）由以上两个模型，我们可以总结出一个零样本学习的简单模式：

上图中，images space和label space分别为初始的图像空间和标签空间，在零样本学习中，一般会通过一些方法将图片映射到特征空间中，这个空间称为feature embedding ；同样的标签也会被映射到一个label embedding 当中，学习feature embedding 和label embedding 中的线性或非线性关系用于测试时的预测转化取代之前的直接由images space 到 label space的学习。

冀中等在文献［4］中，将零样本学习的发展分为两个阶段，上文我们介绍的属于第一阶段，即提出阶段，这个阶段主流的研究思路是，利用“浅层视觉特征+ 属性+ 传统机器学习方法” 的分析模式；第2 阶段的时间大致为2013-2019 年，称为发展阶段，这个阶段的主流研究思路是利用“深度视觉特征+ 属性/词向量+ 传统机器学习方法” 的分析模式。在这一阶段，受益于深度学习技术的发展，特别是CNN模型、Word2Vec的提出，零样本学习得到了较快的发展。

篇幅有限，在这里就先介绍Lampert和Hinton的一些思想和做法，这是比较基础的也是一般的方法。其他最新的方法，有空再写一篇新的吧，不然这篇内容写太多了。详见参考文献［5］。

介绍一下数据集：

在零样本学习中，最为常用的数据集是Animals with Attributes （AwA）数据集，此外，在零样本学习中广泛应用的属性数据集还有三个： Caltech-UCSD-Birds200-2111（CUB）、Attribute Pascal and Yahoo （aPY）数据集以及SUN attribute 数据集。这些数据集很容易下载到。

一些主要的挑战？（challenge）从入门到放弃？哈哈哈哈，是的，有一些很难解决的问题在这里。

虽然如前文所说，零样本学习仍处于快速发展的阶段，但零样本学习由于其自身方法中存在的问题，这些问题使得零样本学习的研究遇到很大的障碍。这三个障碍分别是广义（泛化）零样本学习（Generalized zero-shot learning）、枢纽化问题（Hubness）、映射域偏移问题（The projection domain shift problem）。下面简单介绍一下这几个问题：

（1）广义零样本学习

在实际的应用中，目前的零样本学习与现实应用的学习环境，出现了一定程度的矛盾，这是因为，在零样本学习的假设在测试阶段，只有未见类样例出现。这在实际应用中这种假设是不现实的，往往已见类的样例是现实世界中最为常见的样例，而且，如果在训练阶段已见类样本容易得到、未见类样本难以获取，那么在测试阶段就也不应只有未见类样例出现。所以，为了让零样本学习真实的反应实际应用中的样例识别场景，零样本学习模型应对包括未见类和已见类的所有输入样例进行识别，即大量的已见类样例中夹杂着少量的未见类样例，输入样例的可能类标签大概率属于已见类，但也有可能属于未见类。如果在测试阶段，模型可以准确识别已见类样例，且可以识别从未见过的未见类样例，那么就认为该模型实现了广义零样本学习。

由于模型在训练时，只使用了已见类样本进行训练，且已见类的先验知识也更加丰富，这就导致已见类模型占主导地位。所以在测试时，模型会更加倾向于对未见类样例标注为已见类的标签，进而导致识别的准确率和传统零样本学习相比大幅度下跌。

（2）枢纽化问题

枢纽化问题（Hubness），并不是ZSL所特有的问题，凡是利用特征子空间的学习模型，在实验中都发现了这个现象。由于目前零样本学习中，最为流行的方法就是将输入样例嵌入到特征子空间中，这就导致了ZSL中的Hubness尤为突出。枢纽化问题是指，将原始空间（如图像特征空间或类标签空间）中的某个元素映射到特征子空间中，得到原始空间中某个元素的在特征子空间中的新表示，这时如果使用K 近邻，可能会有某些原始空间中的无关元素映射到多个测试样本特征空间中表示最近的几个近邻中，而这些无关向量，就称为枢纽（hub）。

（3）映射域偏移问题

产生映射域偏移问题的根源在于映射模型较差的泛化能力：模型使用了训练类样本学习由样例特征空间到类标签语义空间的映射，由于没有测试类的未见类样例可以用于训练，因此，在映射测试类的输入样例的时候，就会产生一定的偏差。

未来可能会怎么样？（future）

（1）如果可以使用更好的算法，利用网络上现有的文本内容（例如各个类标签的维基百科），因为网络中的文本内容都是唾手可得的，可以大大减少零样本学习的工作成本，使得零样本学习推广到更多方面。

（2）图像特征映射函数以及语义向量映射函数是零样本学习的核心，可以考虑将语义向量映射至图像特征空间中，或是同时引入这两种映射，可能会得到更好的实验结果。

（3）和单样本、小样本学习结合，构建较为统一的模型。

（4）开集识别和ZSL结合的GZLS。

（5）有研究将零样本学习和强化学习结合，也就是将ZSL的目标设计进强化学习的模型中去，使得agent能够执行在训练阶段未曾传授给它的知识。

（6）更加广泛的应用。除了常见的图像分类和视频事件检测，还可以将零样本学习应用到图像标注、多媒体跨模态检索、视频摘要、情感识别、行人再识别、自动问答、目标检测等不同领域。

有没有代码可以跑一下？（code）6.1 CVPR2019

l CADA-VAE： Edgar Schönfeld， Sayna Ebrahimi， Samarth Sinha， Trevor Darrell， Zeynep Akata. “Generalized Zero- and Few-Shot Learning via Aligned Variational Autoencoders.” CVPR （2019）。［pdf］［code］

l GDAN： He Huang， Changhu Wang， Philip S. Yu， Chang-Dong Wang. “Generative Dual Adversarial Network for Generalized Zero-shot Learning.” CVPR （2019）。［pdf］［code］

l DeML： Binghui Chen， Weihong Deng. “Hybrid-Attention based Decoupled Metric Learning for Zero-Shot Image Retrieval.” CVPR （2019）。［pdf］［code］

l LisGAN： Jingjing Li， Mengmeng Jin， Ke Lu， Zhengming Ding， Lei Zhu， Zi Huang. “Leveraging the Invariant Side of Generative Zero-Shot Learning.” CVPR （2019）。［pdf］［code］

l DGP： Michael Kampffmeyer， Yinbo Chen， Xiaodan Liang， Hao Wang， Yujia Zhang， Eric P. Xing. “Rethinking Knowledge Graph Propagation for Zero-Shot Learning.” CVPR （2019）。［pdf］［code］

l Tristan Hascoet， Yasuo Ariki， Tetsuya Takiguchi. “On Zero-Shot Learning of generic objects.” CVPR （2019）。［pdf］［code］

l AREN： Guo-Sen Xie， Li Liu， Xiaobo Jin， Fan Zhu， Zheng Zhang， Jie Qin， Yazhou Yao， Ling Shao. “Attentive Region Embedding Network for Zero-shot Learning.” CVPR （2019）。［pdf］［code］

6.2 NeurIPS 2019

l Zero-shot Knowledge Transfer via Adversarial Belief Matching.［code］： https://github.com/polo5/ZeroShotKnowledgeTransfer

l Transductive Zero-Shot Learning with Visual Structure Constraint.［code］： https://github.com/raywzy/VSC

6.3 CVPR 2020

l Instance Credibility Inference for Few-Shot Learning

论文地址：https://arxiv.org/abs/2003.11853

代码：https://github.com/Yikai-Wang/ICI-FSL

编辑：黄飞

阅读全文

深度学习(119798) 深度学习(119798)
自然语言处理(13090) 自然语言处理(13090)
nlp(21784) nlp(21784)
半监督学习(2473) 半监督学习(2473)

CFA二级思维导图分享：机器学习

在机器学习中，训练模型的算法数据集包括：训练样本（Trainning Sample），检验样本（validation sample）、验证样本（Testing Sample）。训练样本用于训练得出模型，检验样本用于修正模型，验证样本用于检验模型的有效性。

2020-01-16 09:25:00

1548

机器学习模型类型分类

。Y = f (X)，训练数据通常是(n×x,y)的形式，其中n代表训练样本的大小，x和y分别是变量X和Y的样本值。有监督学习可以被分为两类：分类问题：预测某一样本所属的类别（离散的）。比如判断性别，是否健康等。回归问题：预测某一样本的所对应的实数输出（连续的）。

2023-09-05 11:45:06

1161

学习LabVIEW哪本比较经典？新手求建议

小弟开始学习LabVIEW不知道看哪本书好，哪本比较经典，请各位大侠献言献策，小弟先谢谢了

2013-09-02 16:15:54

学习multisim的一本红宝书

`学习multisim的一本红宝书傻瓜教程原理解析深层次教你搞掂电路仿真 `

2012-08-18 10:01:35

样本管理

智能样本管理系统，可轻松管理您的样本，现已完善，如果有需求，可根据您的需求量身打造属于您自己的样本管理系统，联系电话：010-68683182E-mail：service@huitonghealthcare.com

2017-10-11 09:54:57

零基础图像处理

今年读研，导师要我搞图像处理这方面，但我零基础，就买了本MATLAB图像处理宝典开始看，这样学行吗，唉。。。希望各位高手指导下引导我入门，谢谢

2013-07-05 09:32:33

零基础学习PiC单片机

零基础学习PiC单片机http://pan.baidu.com/s/1o61Je4q

2015-05-03 11:44:36

零基础可以学会单片机吗

纯地想得到它，但是你并没此付出过真正的努力。真正的努力不是你看一本书，像看电影一样把视频教程浏览一遍。我当初在自学单片机的时候也很痛苦，没人带，教程也没现在丰富 (10年前)。碰到了问题，就只能在一些技术论坛求助，但是大多数都是石投大海，有时候一个小问题要解决2天。过

2022-01-17 06:00:22

零基础如何学习stm32？

2021-12-21 07:53:52

零基础学stm32要多久

零基础学stm32要多久@EnzoReventonUSART串口通讯实验篇最近开始接触了STM32F4xx系列单片机，对于我这个从零开始学习的小白来说，可谓困难重重，我是跟着“正点原子”和“野火

2021-07-20 08:17:01

零基础怎么学习G语言

想学习G语言，感兴趣，买了本labview教程，但是不知道从哪里入手，怎么从头有效率的学习它，求解答

2013-10-22 19:09:22

零基础怎样学习Labview

我是刚到职场的新人，从没接触过labview，公司用的是8.2版本的，我想好好学习这个软件（或者说这门语言），请问高手们我该从哪里入手，我是真真的零基础啊~~~谢谢了

2012-02-22 22:36:40

零基础，想学ARM，求指导一下应该先学什么，以及学习顺序？

零基础想学ARM，求指导一下应该先学什么，以及学习顺序？

2019-03-18 19:50:12

零死角学习STM32

2014-07-04 18:36:04

ARM入门，零基础学习。

ARM入门，零基础学习。自学过，觉得非常好。分享一下。

2013-03-24 16:31:06

FPGA零基础学习：LED流水灯设计

要做的流水灯，顾名思义就是要LED像流水一样的点亮熄灭。直白点说就是，点亮第一个一段时间，然后熄灭第一个的同时，点亮第二个·····。在此，我们设置每一个LED点亮的时间为1秒钟。 · 硬件介绍在

2023-03-07 16:39:52

I2S如何填充到样本数据

＝CyuU3pII2sWithth1616BIT；状态= CYU3PI2SSETCONFIG（和；I2SCFG，NULL）；如果PAD模式是正常的，那么在32位样本数据中，LSB应该用零填充。在上面的示例代码中，它将I2S配置为

2018-11-15 16:02:24

JAVA从零开始学习知识整理

JAVA从零开始学习知识整理——MySql——day05—【hqC】

2020-06-14 16:15:28

PADS-VX-零入门学习视频

本帖最后由 qgg1006 于 2015-3-14 14:14 编辑 PADS-VX-零入门学习视频链接：http://pan.baidu.com/s/1hq6Dcji 密码：5ipl

2015-03-14 22:00:51

【咨询帖】请问从零开始学习单片机开发需要一个怎样的学习流程……

请问从零开始学习单片机开发需要一个怎样的学习流程……网上搜索出来一大箩筐，不知道哪个才是靠谱的…… 感觉找不到路……感谢各位前辈指教

2016-05-20 15:19:16

不错的一本学习资料

不错的一本学习资料，分享下

2016-01-15 18:27:20

为什么我们要学习这个ucosii，学习它对我们有什么样的好处吗？

今天在问ucosii的时候，几个大神级别的说现在学这个ucosii已经没有多大的意义了，而且现在工业上都不用这个ucoii的，当我说是为了将来的linux打点基础，但是他们却说，这个和linux没有半毛钱的关系，大家可以给我说说为什么我们要学习这个ucosii，学习它对我们有什么样的好处吗？

2019-04-04 06:36:22

从零开始学习layout

哪位高人有从零开始学习layout的教程，请帮忙提供一下，万分感谢！

2016-07-23 15:15:35

从零开始学习单片机要怎样

从零开始学习单片机，前辈们给点指导。

2013-12-25 20:18:08

从零开始学习嵌入式开发和PCB设计，怎样开始

各位大神好：我是学习机械设计的，现在想从零开始学习嵌入式开发和PCB设计，请问需要学习哪些方面的知识？最好能推荐下课本或者课程，十分感谢！

2021-05-15 00:29:30

从零开始学习电路

2013-06-02 19:27:58

从零开始学习，请多指教

2013-11-25 23:09:44

分享一本430的学习资料

我也正在学习430，弄到了本学习资料，分享给大家。

2014-02-18 22:59:53

分享一本学习xilinx FPGA的好书

2014-07-18 13:44:26

变频器如何学习，怎么样检测好坏？

2016-04-14 07:02:14

各位大神，学习stm32和学习51有什么区别啊，该怎么样去学习呢。

2017-01-09 08:32:36

如何零基础的学习STM32F1系列单片机？

2021-11-04 07:07:13

如何从零学习嵌入式linux开发

的学，需求耐性的学。关于一个零根底的人来说，学习嵌入式仍是有必定难度的。关于一个大学电子或计算机专业的人员来说，学习单片机，嵌入式仍是要便利一些。关于没有电路根底，没有编程根底的人来说，学习大概先根本

2014-08-03 12:45:39

如何从零基础学习嵌入式开发

最靠谱的从零开始学习嵌入式开发之路如何从零基础学习嵌入式开发，我在这里给大家一个切实可行的道路，而且相对容易入手，学习中会不断有收获。掌握单片机，嵌入式开发是每个硬件工程师必修课程。但嵌入式开发

2021-11-08 06:49:00

如何从零基础学习嵌入式开发？

如何从零基础学习嵌入式开发，我在这里给大家一个切实可行的道路，而且相对容易入手，学习中会不断有收获。

2021-02-26 07:56:20

如何从零开始学习嵌入式开发技术？

如何从零开始学习嵌入式开发技术，进入嵌入式开发大门呢？

2021-04-02 06:32:28

如何接收PSOC 5LP音频样本？

我在西班牙格拉纳达大学学习计算机科学。我有一个Android应用程序，从MP3文件中提取16位音频样本。我需要接收这些样品在44.1 KHZ与HC-06蓝牙模块连接到我的PSoC5LP。我需要一些

2019-10-16 07:09:03

学编程，写软件，写辅助，零基础学习

技术免费分享，QQ空间，Q钻等等，想找一本好的网络方面的只是书籍？我们这里收藏了许多优秀书籍的下载地址。欢迎加入我们：cpproad.com让我们一起从零基础开始学习网络编程技术！

2013-11-18 07:46:06

完整的电容样本及参数规格

电容样本及参数规格 [hide]电容样本.rar[/hide]

2009-10-09 15:32:27

实施4条线阻塞触摸板控制的NUC126样本代码

应用:这一基于NUC126的样本代码,用于实施4条线阻塞触摸板的控制。 BSP 版本: NUC126系列 BSP CMSIS v3.00.003 硬件:NuTiny-NUC126 目前市场上有4条

2023-08-23 06:37:54

建筑业企业资质证样本

`建筑业企业资质证样本建筑业企业资质证样本建筑业企业资质证样本建筑业企业资质证样本建筑业企业资质证样本建筑业企业资质证样本建筑业企业资质证样本建筑业企业资质证样本建筑业企业资质证样本建筑业企业资质证样本建筑业企业资质证样本建筑业企业资质证样本建筑业企业资质证样本`

2016-11-28 21:48:55

怎样从零开始学习fpga。

我是听别人说fpga的，而且还听说是硬件工程师必会的技能，我的理想就是成为工程师，但是我以前都没有接触过fpga，可以说是零基础。所以跪求大神介绍学习方法，应该买什么学习板，准备什么软件？

2015-08-17 12:41:33

想问下高手们，学习labview比较经典的教材是哪本呢？求推荐

想问下高手们，学习labview比较经典的教材是哪本呢？求推荐新手学习中。。

2013-12-18 10:24:20

我电力专业。想学习嵌入式，零基础。找哪家培训机构比较靠谱？将来就业和发展行情怎么样？求大神指教

本帖最后由徐徐000 于 2016-1-26 23:21 编辑我电力专业。想学习嵌入式，零基础。找哪家培训机构比较靠谱？将来就业和发展行情怎么样？求大神指教

2016-01-26 23:17:52

新技术在生物样本冷冻中的应用案例分析

、生物分子等提供了重要的实验手段。　　新技术在生物样液氮罐本冷冻中的应用案例分析表明，这些创新方法为生物学研究提供了更高效、可靠和经济的样本处理解决方案。低温离心、冷冻探头技术和冷冻显微镜技术等

2023-12-26 13:30:34

智能样本管理系统

` 智能样本管理系统，方便、快捷管理您的样本，在功能上可根据您的需求修改和增加功能，帮助您在使用上面更加人性化。我们还可根据您的需求来制定一个属于您的管理系统。联系电话：010-68683182E-mail：service@huitonghealthcare.com`

2017-10-20 09:18:10

清洗误标注的开发集和测试集样本

误标注的样本，因为这些误差在整体误差中的占比会逐渐增大。上一章中解释了如何通过算法改进类似于狗、大猫和模糊图片的误差类别，而在本章你学习了如何通过修正数据的标签来处理误标注的样本。不论你使用什么方式

2018-12-19 09:48:13

请大家推荐2本单片机学习书我刚开始学习

大家好关于51AVR 单片机学习可以推荐一本零基础开始到高手的书吗谢谢

2013-01-12 13:29:11

请问零基础怎么学习电子电路技术

大家好，我现在是零基础，我想学习修汽车电脑版？请各位大神能否给指条路，学习过程是什么？

2019-03-12 06:42:02

请问蓝牙模块有通用的设计样本吗

现在网上卖的蓝牙模块设计都是一样的，用csr 设计 pcb板子布置都一摸一样，是不是有有通用的设计样本啊求解

2019-01-14 01:17:24

基于PRank算法的主动排序学习算法

针对排序学习中如何选择最值得标注的样本和通过尽可能少的已标注样本训练出较好的排序模型的问题，将主动学习的思想引入排序学习中，提出一种基于排序感知机的主动排序学

2009-04-11 09:24:31

基于子空间样本选择的最近凸包分类器

最近邻凸包分类器需要求解测试样本到训练集凸包距离的凸二次规划问题，对于训练集规模较大的情况，有必要在分类之前进行适当的样本选择。为此该文提出基于子空间样本选择

2009-04-20 09:47:59

斑梨电子英语智能发声单词卡电子便携记背单词神器学习机四级单词本记忆本大学高中初中小学护眼墨水屏

斑梨电子英语智能发声单词卡电子便携记背单词神器学习机四级单词本记忆本大学高中初中小学护眼墨水屏产品简介:电子单词卡真人朗读英语背单词神器墨水屏护眼单词卡。无蓝光屏、超长续航、真人发音

2022-08-23 13:10:54

基于支持样本的快速增强学习算法

针对确定性马尔克夫决策过程，本文提出了一种基于支持样本的快速增强学习算法。文章首先把学习问题形式化为一个确定性的马尔可夫决策过程，并对问题空间中每个状态的总

2010-01-22 12:18:40

图灵样本V4.0-小

2016-12-25 22:29:29

易往信息EW-EMS样本

2016-12-25 22:25:31

基于直推判别字典学习的零样本分类方法

零样本分类的目标是对训练阶段未出现过的类别的样本进行识别和分类，其主要思路是，借助类别语义信息，将可见类别的知识转移到未见类别中．提出了一种直推式的字典学习方法，包含以下两个步骤：首先，提出一个判别

2017-12-25 10:15:44

矩阵式瀑布分类器高效学习算法

针对矩阵式瀑布分类器学习算法在负样本自举过程中无法快速自举出训练所需的高质量样本，自举过程严重影响整体学习效率及最终检测器性能等问题，提出了一种高效学习算法负样本信息继承的矩阵式瀑布分类器高效学习

2018-01-04 16:59:49

多示例多标记学习方法

通过概率潜在语义分析模型学习到所有训练样本的潜在主题分布，该过程是一个特征学习的过程，用于学习到更好的特征表达，用学习到的每个样本的潜在主题分布作为输入来训练神经网络。当给定一个测试样本时，学习测试样本的潜在主题分布，将学

2018-01-05 10:22:27

机器学习算法之基于黑盒语音识别的目标对抗样本

本文提出了一种将遗传算法和梯度估计结合的黑盒攻击方法，使之可以产生比单独算法更好的对抗样本.引入了一个新的黑盒攻击领域，特别是在深层非线性的 ASR 系统中可以输出任意长度的转换。作者提出了一种将遗传算法和梯度估计结合的黑盒攻击方法，使之可以产生比单独算法更好的对抗样本。

2018-05-28 06:27:56

3136

小样本学习领域的研究进展

人类从少量样本中去思考，还能用这个做什么；而机器则是见到了上亿的数据，却希望下一个与之前的相似。

2018-06-15 09:11:21

33508

对抗样本真的是bug吗？对抗样本不是Bug, 它们是特征

过去几年里，对抗样本在机器学习社区中得到了极大的关注。关于如何训练模型使它们不易受到对抗样本攻击的工作有很多，但所有这些研究都没有真正地面对这样一个基本问题：为什么这些对抗样本会出现？

2019-05-10 08:54:43

4319

AI的深度学习算法以自动化和标准化来分析医疗样本

来自慕尼黑的Helmholtz ZentrumMünchen和慕尼黑大学LMU的大学医院的研究人员首次显示，在对急性髓性白血病(AML)患者的血液样本进行分类时，深度学习算法的性能与人类专家相似。

2019-11-28 09:28:32

908

机器学习中样本比例不平衡应该怎样去应付

这种现象往往是由于本身数据来源决定的，如信用卡的征信问题中往往就是正样本居多。样本比例不平衡往往会带来不少问题，但是实际获取的数据又往往是不平衡的，因此本文主要讨论面对样本不平衡时的解决方法。

2020-03-30 09:57:36

857

如何用数学函数去理解机器学习的过程

机器学习，需要先学习才能预测判断，样本则是机器学习的信息输入，样本的质量很大程度上决定了机器学习的效果。以人脸识别为例，其样本是大量的人脸图片。那么，大量的样本如何获取？按数据来源分类，可分为内部样本和外部样本。

2020-04-15 15:39:03

1778

答疑解惑探讨小样本学习的最新进展

至于什么样的情况需要专门设计小样本学习算法，其实这是一个很实际或者很工业的问题，比如在医疗图像处理中解决很罕见的病变，样本量确实不够，我们想去学一个分类器就只能根据这个数据去设计小样本学习算法。

2020-05-12 10:20:55

3802

机器学习方法迁移学习的发展和研究资料说明

近年来，迁移学习已经引起了广泛的关注和研究。迁移学习是运用已存有的知识对不同但相关领域问题进行求解的一种新的机器学习方法。它放宽了传统机器学习中的两个基本假设：（1）用于学习的训练样本与新的测试样本

2020-07-17 08:00:00

人工智能：机器学习模型存在着对抗样本的安全威胁

近年来，随着人工智能的蓬勃发展，机器学习技术在网络入侵检测领域得到了广泛的应用。然而，机器学习模型存在着对抗样本的安全威胁，导致该类网络入侵检测器在对抗环境中呈现出特定的脆弱性。本文主要概述由对抗

2020-08-27 16:10:10

3285

使用元学习进行少样本图像分类

首发：AI公园公众号作者：Etienne编译：ronghuaiyang导读你并不总是有足够的图像来训练一个深度神经网络。下面是教你如何通过几个样本让...

2020-12-14 23:28:50

308

深度学习：小样本学习下的多标签分类问题初探

摘要小样本学习（Few-shot Learning）近年来吸引了大量的关注，但是针对多标签问题（Multi-label）的研究还相对较少。在本文中，我们以用户意图检测任务为切入口，研究了的小样本

2021-01-07 14:51:51

6374

一种针对小样本学习的双路特征聚合网络

针对深度学习中使用少量样本完成模型训练的小样本学习问题，构建一种双路的特征聚合网络，并提出种新的综合损失函数对网络模型的参数更新过程加以控制。通过综合损失函数，特征聚合网络可将样本映射到更具代表性

2021-03-22 14:51:15

基于深度学习的自然语言处理对抗样本模型

深度学习模型被证明存在脆弱性并容易遭到对抗样本的攻击，但目前对于对抗样本的研究主要集中在计算机视觉领域而忽略了自然语言处理模型的安全问题。针对自然语言处理领域冋样面临对抗样夲的风险，在阐明对抗样本

2021-04-20 14:36:57

机器学习的训练样本数据选择方法综述

机器学习作为数据挖掘中一种重要的工具，不只是对人的认知学习过程的探索，还包括对数据的分析处理。面对大量数据的挑战，目前一部分学者专注于机器学习算法的改进和开拓，另一部分研究人员则致力于样本数据的选择

2021-04-26 14:45:46

一种为小样本文本分类设计的结合数据增强的元学习框架

01 研究背景及动机近些年，元学习已经成为解决小样本问题的主流技术，并且取得不错的成果。然而，由于现有的元学习方法大多数集中在图像分类上，而对文本分类上的关注比较少。与图像不同，同一类别中文本具有

2021-05-19 15:54:15

4012

噪声样本标签重标注方法综述

样本标签的完整性对于有监督学习问题的分类精度有着显著影响，然而在现实数据中，由于标注过程的随机性和标注人员的不专业性等因素，数据标签不可避免地会受到噪声污染，即样本的观测标签不冋于真实标签。为降低

2021-05-28 16:20:38

关于正样本的表面缺陷检测

，然而这些方法往往是需要大量标注数据的有监督学习。在实际的工业场景中，缺陷样本往往是难以收集的，而且标注的成本也十分巨大。针对上述有监督学习在实际应用中存在的问题，本文提出了一种仅基于正样本训练的缺陷检测方

2021-05-29 10:23:16

2963

样本量极少可以训练机器学习模型吗？

本文首先介绍了用小样本训练模型会导致的问题，再介绍了Few-Shot Learning的基本原理即三大思路下的方法。

2021-06-23 15:02:11

6238

功效与样本量的计算

我经常被问到这样的问题：“做假设检验时，需要的样本量是多少”， “我的实验究竟需要多少样本才有意义呢？”，这类问题可以通过功效与样本量计算来解决。什么是功效？所有检验都不可能尽善尽美，总存在

2022-02-08 16:12:18

594

融合零样本学习和小样本学习的弱监督学习方法综述

融合零样本学习和小样本学习的弱监督学习方法综述来源：《系统工程与电子技术》，作者潘崇煜等摘要: 深度学习模型严重依赖于大量人工标注的数据，使得其在数据缺乏的特殊领域内应用严重受限。面对数据缺乏

2022-02-09 11:22:37

1731

一种基于伪标签半监督学习的小样本调制识别算法

一种基于伪标签半监督学习的小样本调制识别算法来源：《西北工业大学学报》，作者史蕴豪等摘要：针对有标签样本较少条件下的通信信号调制识别问题，提出了一种基于伪标签半监督学习技术的小样本调制方式分类

2022-02-10 11:37:36

627

基于k近邻与高斯噪声的虚拟困难样本增强方法

然而在无监督SimCSE中，作者仅使用dropout的方式进行了正样本增强，没有额外引入困难样本，这在一定程度上限制了模型的能力。基于这个动机，亚马逊提出了一种基于k近邻与高斯噪声的虚拟困难样本增强的无监督对比学习方法VaSCL。

2022-05-12 11:31:04

815

双塔模型扩量负样本的方法比较

双塔模型在训练时是对一个batch内样本训练。一个batch内每个样本 (user和item对)为正样本，该user与batch内其它item为负样本。这样训练的方式可能有以下问题：

2022-07-08 10:57:16

817

对比学习中的4种典型范式的应用分析

学习效果好，一个核心点是扩大对比样本（负样本）的数量，即每次更新梯度时，query见到的不匹配key的数量。负样本数量越多，越接近对比学习的实际目标，即query和所有不匹配的key都距离远。

2022-07-08 11:03:49

1514

PiCO核心点—对比学习引入PLL

有监督学习是最常见的一种机器学习问题，给定一个输入样本，预测该样本的label是什么。Partial Label Learning（PLL）问题也是预测一个样本对应的label，但是和有监督学习问题的差异是

2022-08-22 11:35:57

889

常见的小样本学习方法

由于在训练过程中没有足够的标记图像用于所有类，这些模型在现实环境中可能不太有用。并且我们希望的模型能够识别它在训练期间没有见到过的类，因为几乎不可能在所有潜在对象的图像上进行训练。我们将从几个样本中学习的问题被称为“少样本学习 Few-Shot learning”。

2022-11-01 14:21:24

1521

基于深度学习的零样本SAR图像目标识别

将该框架推广到广义零样本学习，并针对域偏置问题，提出了- -种基于语义知识的域检测方法。利用域检测方法可以先将未见类别和已见类别进行区分,然后用两个模型分别在两个域进行分类，从而有效缓解域偏置问题。

2022-12-29 14:27:27

398

一个通用的自适应prompt方法，突破了零样本学习的瓶颈

为了解决这个问题，这篇研究提出了一种Universal Self-adaptive Prompting (USP)方法，对LLMs的零样本学习进行了优化，同时也适用于少样本学习任务。USP只需要少量

2023-06-01 14:48:01

460

小样本学习领域的未来发展方向

什么是小样本学习？它与弱监督学习等问题有何差异？其核心问题是什么？来自港科大和第四范式的这篇综述论文提供了解答。数据是机器学习领域的重要资源，在数据缺少的情况下如何训练模型呢？小样本学习是其中

2023-06-14 09:59:27

565

高效扩充样本库 | AIDG AI 样本生成器 2.0 焕新而来

高质量样本有利于快速构建理想的深度学习模型，然而在动力电池、3C电子、汽车制造等高良率的生产场景中，想要获取足够数量的缺陷样本用于AI品质检测，可能需要做出额外的努力。用图像处理软件制作缺陷样本

2023-05-08 09:41:18

923

基于GAN的零缺陷样本产品表面缺陷检测

缺陷检测是工业生产过程中的关键环节，其检测结果的好坏直接影响着产品的质量。而在现实场景中，但产品瑕疵率非常低，甚至是没有，缺陷样本的不充足使得需要深度学习缺陷检测模型准确率不高。如何在缺陷样本

2023-06-26 09:49:01

549

如何在缺陷样本少的情况下实现高精度的检测

导读缺陷检测是工业生产过程中的关键环节，其检测结果的好坏直接影响着产品的质量。而在现实场景中，但产品瑕疵率非常低，甚至是没有，缺陷样本的不充足使得需要深度学习缺陷检测模型准确率不高。如何在缺陷

2023-06-26 09:54:04

688

单样本微调给ChatGLM2注入知识

LoRA微调是一种高效的融入学习算法。类似人类把新知识融入现有知识体系的学习过程。学习时无需新知识特别多的样本，学习后原有的庞大知识和能力可以基本不受影响。

2023-07-18 14:44:39

2543

已全部加载完成

搜索历史

什么是零样本学习？为什么要搞零样本学习？

评论