一种新颖的标签驱动去噪框架(LDF)
然后,查询集利用原型生成相应的查询表示。最后,通过测量每个原型表示与相应查询表示之间的距离来进行类别....
基于VLP模型的语义对齐机制
在本文中,我们利用图像描述模型提出一个新颖的探针方法。通过这个方法,我们从文本角度分析了VLP模型的....
用于学习对象级、语言感知和语义丰富视觉表征的GLIP模型
Visual recognition 模型通常只能预测一组固定的预先确定的目标类别,这限制了在现实世....
Transformer常用的轻量化方法
引言:近年来,Transformer模型在人工智能的各个领域得到了广泛应用,成为了包括计算机视觉,自....
MRC和QA中使用的思想方法在信息抽取任务中的应用
主要的评测标准有常见的准确率P、召回率R和F1值。在上述四个任务的前三个中,使用P、R、F1可以满足....
一种基于prompt和对比学习的句子表征学习模型
我们发现prompt,再给定不同的template时可以生成不同方面的positive pair,且....
基于BIO序列标注的方法和基于片段的图解析方法
该论文的出发点是将端到端基于片段的(span-based)语义角色标注(SRL)转换为基于词的(wo....
一个全新的文本到视频跨模态检索子任务
PRVR任务旨在从大量未剪辑的长视频中检索出与查询文本部分相关的对应视频。若一个未经剪辑的长视频中存....
分享微博在特征Embedding建模方向做的一些工作
首先我们对比自然语言处理和图像处理:NLP 最基本的数据元素是单词,每个单词有一定的含义,可能指代某....
面向社交媒体的多模态属性级情感分析
另一方面,相比于单一的文本数据,多模态数据包含了多种不同信息,这些信息之间往往一一对应、互为补充,如....
半监督学习代码库存在的问题与挑战
当使用监督学习(Supervised Learning)对大量高质量的标记数据(Labeled Da....
扩散模型应用在自然语言处理中的应用
对该证据下界的变形的形式,我们可以直观地这么理解:证据下界等价于这么一个过程,我们用编码器将输入 x....
GAT模型如何来编码依存关系
本文贡献有如下两点: 提出了一个面向方面的树结构,通过重塑和修剪普通的依存树来关注目标方面。 提....
基于用于自然语言生成的“语境调优”技术
自然语言生成(又称为文本生成)旨在基于输入数据用人类语言生成合理且可读的文本。随着预训练语言模型的发....
借助机器翻译来生成伪视觉-目标语言对进行跨语言迁移
然而之前的基于机器翻译的CCR工作大多忽略了这个问题,它们通常使用大规模的预训练模型在通过机器翻译得....
文本噪声标签在预训练语言模型(PLMs)上的特性
数据的标签错误随处可见,如何在噪声数据集上学习到一个好的分类器,是很多研究者探索的话题。在 Lear....
CLarET:实现上下文到事件相关感知的预训练模型
自然语言文本里描述的“事件”,通常是由一个谓词及其论点组成的一个文本片段(span),是一个细粒度的....
文本分类中处理样本不均衡和提升模型鲁棒性的trick
文本分类看似简单,但实则里面有好多门道。作者水平有限,只能将平时用到的方法和trick在此做个记录和....
基于训练阶段使用知识库+KNN检索相关信息辅助学习方法
上面收的引入知识库+KNN的方法,缓解了模型参数需要强记忆训练样本的问题。此外,文中还通过KNN检索....
关于AE、OE、SC的序列标注问题
首先从中利用CNN编码上下文特征,然后将共享向量视为query方面,并用注意力机制计算query和上....
基于重叠和嵌套事件抽取领域的主流方法
具体的词对关系分类示例如图2所示。其中S-T表示两个词是某个触发词的头部和尾部,S-A表示两个词是某....
什么是嵌套实体识别
嵌套命名实体识别是命名实体识别中的一个颇具挑战的子问题。我们在《实体识别LEAR论文阅读笔记》与《实....
如何计算模型对预测结果的信心
在很多问题中,获取标注准确的大量数据需要很高的成本,这也往往限制了深度学习的应用。主动学习通过对未标....
研究人员为多模态NER任务提出新颖的关系增强图卷积网络
命名实体识别(NER)是信息抽取的一项基本任务,它的目的是识别文本片段中的实体及类型,如人名(PER....
一个基于参数更新的迁移学习的统一框架
它提出一个基于参数更新的迁移学习的统一框架,建立多种参数优化方法之间的联系,从而方便理解不同方法背后....
针对文本生成任务提出一种基于提示的迁移学习方法
理解是一个复杂且多面的能力,包括对文本词汇、背景知识、语言结构的理解。因此,我们采用GLUE, Su....
预先训练的语言模型能像人类一样聪明地解释明喻吗?
明喻主要分为两类:封闭式明喻(ClosedSimile),以及开放式明喻(OpenSimile)。如....
NLP中的神经网络设计与学习
近些年来,人工神经网络方法已经成为了自然语言处理中最重要的范式之一。但是,大量依赖人工设计的神经网络....
基于“结构决定性质”零样本三维药物设计方法
药物设计(Drug Design)旨在针对给定的生物靶点(通常为蛋白质口袋)提供符合设计要求的候选分....