使用BLIP-2 零样本“图生文”
现代计算机视觉和自然语言模型在能力越来越强大的同时,模型尺寸也随之显著增大。由于当前进行一次单模态模....
LeCun新作:全面综述下一代「增强语言模型」
最近图灵奖得主Yann LeCun参与撰写了一篇关于「增强语言模型」的综述,回顾了语言模型与推理技能....
深入浅出Prompt Learning要旨及常用方法
第三范式:基于预训练模型 + finetuning 的范式,如 BERT + finetuning ....
SimANS:简单有效的困惑负样本采样方法
为训练该稠密检索模型,已有方法通常基于一对比学习训练目标,即拉近语义一致的Query和Documen....
LLaMA论文研读:小参数+大数据的开放、高效基础语言模型阅读笔记
这些努力都是基于这样的假设:更多的参数会带来更好的性能。然而,Hoffmann等人(2022)最近的....
小程序:ChatGPT-Plus助手发布啦!
在智能客服系统中,ChatGPT技术可以用于自动化的问题解答,为用户提供更加智能、高效的服务。例如,....
Language Model Reasoning是什么意思?
那么,前面总是提到推理 (Reasoning) 这个词,什么是推理?我尝试用自己的语言来解释“推理”....
复旦大学NLP实验室《自然语言处理导论》 网络初版发布
复旦大学自然语言处理实验室张奇教授、桂韬研究员以及黄萱菁教授从2020年起着手教材的规划,结合自己对....
AI超级帮手的用法大全
它可以根据提供的关键词或主题生成相关领域的文本,并提供有关行业趋势,市场规模和其他相关信息。此外,它....
什么是query理解?query理解目前的主要作用
但需要强调的,是为什么我们要去做query理解,因为它存在的意义才是我们持续讨论他在后续chatgp....
介绍一种基于Transformer的大语言模型
大模型的研究者和大公司出于不同的动机站位 LLM,研究者出于对 LLM 的突现能力 (emergen....
介绍NMT模型鲁棒性对抗训练的三部曲
本文的问题引入为一个小实验,即将机器翻译的源句进行微小扰动(同义词替换),69.74%的翻译句子也随....
以transformers框架实现中文OFA模型的训练和推理
OFA是阿里巴巴发布的多模态统一预训练模型,基于官方的开源项目,笔者对OFA在中文任务上进行了更好的....
介绍一种信息抽取的大一统方法USM
信息抽取任务具有多样的抽取目标和异构的结构,而传统的模型需要针对特定的任务进行任务设计和标签标注,这....
chatgpt下非端到端方案是否还有意义
其实端到端和非端到端的竞争,早在前几年就有了,DSTC对话系统的比赛,榜单上就已经分为了端到端和非端....
详细分析14种可用于时间序列预测的损失函数
在处理时间序列预测问任务时,损失函数的选择非常重要,因为它会驱动算法的学习过程。以往的工作提出了不同....
性别偏见探索和缓解的中文数据集-CORGI-PM
大规模语言模型(LMs)已经成为了现在自然语言处理的关键技术,但由于训练语料中常带有主观的性别偏见、....
解读ChatGPT背后的技术重点:RLHF、IFT、CoT、红蓝对抗
我们先来看看基于语言模型的会话代理的全景。ChatGPT 并非首创,事实上很多组织在 OpenAI ....
一个真实闲聊多模态数据集TikTalk
随着大量预训练语言模型在文本对话任务中的出色表现,以及多模态的发展,在对话中引入多模态信息已经引起了....
一文浅谈Graph Transformer领域近期研究进展
本文提出了几种自动生成子图表示的方法,并从理论上表明,生成的表示至少与子图表示具有相同的表达能力。该....
一种灵活有效的事件抽取数据增强框架-Mask-then-Fill
事件抽取,即从非机构化文本中抽取指定的事件的触发词及其事件要素,为了减轻人工标注,常采用数据增强方法....
深度学习顶级学术会议ICLR 2023录用结果已经公布!
在机器学习社区中,ICLR 是较为「年轻」的学术会议,它由深度学习巨头、图灵奖获得者 Yoshua ....
视觉-语言预训练入门指南
视觉-语言 (Vision-Language, VL) 是计算机视觉和自然语言处理这两个研究领域之间....
有了Fine-tune-CoT方法,小模型也能做推理,完美逆袭大模型
如果给语言模型生成一些 prompting,它还向人们展示了其解决复杂任务的能力。标准 prompt....
具有Event-Argument相关性的事件因果关系提取方法
事件因果关系识别(ECI)旨在检测两个给定文本事件之间是否存在因果关系,是事件因果关系理解的重要任务....
Prompt Tuning相比于Fine Tuning在哪些场景下表现更好?
第三范式:基于「预训练模型 + finetuning」的范式,如 BERT + finetuning....
文本分割技术的应用场景
这些文本通常都非常长,需要利用文本分割技术来处理这些文本,将它们按照主题的转移或变化划分为若干主题段....
基于预训练语言模型的行业搜索的应用和研究
面向产业和消费互联网的搜索本质都是一样的:用户有信息获取需求,同时有信息资源库,通过搜索引擎把两者桥....