0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深度学习自然语言处理

文章:837 被阅读:208.9w 粉丝数:42 关注数:0 点赞数:5

广告

一个通用的自适应prompt方法,突破了零样本学习的瓶颈

为了解决这个问题,这篇研究提出了一种Universal Self-adaptive Promptin....
的头像 深度学习自然语言处理 发表于 06-01 14:48 785次阅读
一个通用的自适应prompt方法,突破了零样本学习的瓶颈

探索ChatGPT的信息抽取能力

通过人工检查ChatGPT的回复,发现ChatGPT倾向于识别比标注的跨度更长的sapn,以更接近人....
的头像 深度学习自然语言处理 发表于 06-01 14:45 1159次阅读
探索ChatGPT的信息抽取能力

State of GPT:大神Andrej揭秘OpenAI大模型原理和训练过程

你可以看到,Llama 的参数数量大概是 650 亿。现在,尽管与 GPT3 的 1750 亿个参数....
的头像 深度学习自然语言处理 发表于 05-30 14:34 1063次阅读
State of GPT:大神Andrej揭秘OpenAI大模型原理和训练过程

和ChatGPT相关的所有评估可能都不做数了!

不幸的是,我们对 ChatGPT 和许多其他封闭式 LM 背后的细节几乎一无所知:架构、epoch、....
的头像 深度学习自然语言处理 发表于 05-30 14:30 568次阅读
和ChatGPT相关的所有评估可能都不做数了!

LLM在各种情感分析任务中的表现如何

  最近几年,GPT-3、PaLM和GPT-4等LLM刷爆了各种NLP任务,特别是在zero-sho....
的头像 深度学习自然语言处理 发表于 05-29 17:24 2359次阅读
LLM在各种情感分析任务中的表现如何

大模型LLM领域,有哪些可以作为学术研究方向?

随着全球大炼模型不断积累的丰富经验数据,人们发现大模型呈现出很多与以往统计学习模型、深度学习模型、甚....
的头像 深度学习自然语言处理 发表于 05-29 14:36 1140次阅读
大模型LLM领域,有哪些可以作为学术研究方向?

ETH提出RecurrentGPT实现交互式超长文本生成

RecurrentGPT 则另辟蹊径,是利用大语言模型进行交互式长文本生成的首个成功实践。它利用 C....
的头像 深度学习自然语言处理 发表于 05-29 14:34 845次阅读
ETH提出RecurrentGPT实现交互式超长文本生成

ChatGPT背后的大模型技术

由于ChatGPT可以适用于非常多的任务,很多人认为 AI 已经迎来拐点。李开复将此前的 AI 定义....
的头像 深度学习自然语言处理 发表于 05-29 11:16 1475次阅读
ChatGPT背后的大模型技术

调教LLaMA类模型没那么难,LoRA将模型微调缩减到几小时

最近几个月,ChatGPT 等一系列大语言模型(LLM)相继出现,随之而来的是算力紧缺日益严重。虽然....
的头像 深度学习自然语言处理 发表于 05-28 10:58 2691次阅读
调教LLaMA类模型没那么难,LoRA将模型微调缩减到几小时

“AI教父”Geoffrey Hinton:智能进化的下一个阶段

十年来,人工智能领域的众多惊人突破背后都离不开深度学习,它是使得ChatGPT、AlphaGo等得以....
的头像 深度学习自然语言处理 发表于 05-26 15:16 617次阅读

大型语言模型能否捕捉到它们所处理和生成的文本中的语义信息

  大型语言模型能否捕捉到它们所处理和生成的文本中的语义信息?这一问题在计算机科学和自然语言处理领域....
的头像 深度学习自然语言处理 发表于 05-25 11:34 727次阅读
大型语言模型能否捕捉到它们所处理和生成的文本中的语义信息

基于实体和动作时空建模的视频文本预训练

摘要 尽管常见的大规模视频-文本预训练模型已经在很多下游任务取得不错的效果,现有的模型通常将视频或者....
的头像 深度学习自然语言处理 发表于 05-25 11:29 780次阅读
基于实体和动作时空建模的视频文本预训练

硬件算法协同设计

在本文中,将探讨了transformer高效训练方法,从存储效率、硬件算法协同设计和计算效率三个角度....
的头像 深度学习自然语言处理 发表于 05-25 10:33 948次阅读
硬件算法协同设计

上交清华提出中文大模型的知识评估基准C-Eval,辅助模型开发而非打榜

首先,把一个模型调成一个对话机器人这件事情并不难,开源界已经有了类似于 Alpaca, Vicuna....
的头像 深度学习自然语言处理 发表于 05-24 15:03 839次阅读
上交清华提出中文大模型的知识评估基准C-Eval,辅助模型开发而非打榜

Meta AI重磅推出LIMA!媲美GPT-4、无需RLHF就能对齐!

天下人苦“对齐”久矣!要让预训练语言模型的响应和特定任务和用户偏好对齐,动辄需要百万示例数据集上的i....
的头像 深度学习自然语言处理 发表于 05-24 15:00 1149次阅读
Meta AI重磅推出LIMA!媲美GPT-4、无需RLHF就能对齐!

大模型在不同任务中的优缺点

如果自己是一个大模型的小白,第一眼看到 GPT、PaLm、LLaMA 这些单词的怪异组合会作何感想?....
的头像 深度学习自然语言处理 发表于 05-23 17:19 3993次阅读
大模型在不同任务中的优缺点

模型表现方面有意思的成果

若干年前,AlphaGo Zero用两个AI代理切磋围棋技艺,打败了人类。今早,符尧的一篇论文刷新了....
的头像 深度学习自然语言处理 发表于 05-23 14:55 455次阅读
模型表现方面有意思的成果

如何对挑选出的demonstration示例进行排序

在demonstration selection的方法中,其中有部分方法也考虑到demonstrat....
的头像 深度学习自然语言处理 发表于 05-23 14:51 586次阅读
如何对挑选出的demonstration示例进行排序

LLM性能的主要因素

现在是2023年5月,截止目前,网络上已经开源了众多的LLM,如何用较低的成本,判断LLM的基础性能....
的头像 深度学习自然语言处理 发表于 05-22 15:26 1722次阅读
LLM性能的主要因素

GPT-4 的模型结构和训练方法

在 GPT-4 的发布报道上,GPT-4 的多模态能力让人印象深刻,它可以理解图片内容给出图片描述,....
的头像 深度学习自然语言处理 发表于 05-22 15:21 2643次阅读
GPT-4 的模型结构和训练方法

邱锡鹏团队提出具有内生跨模态能力的SpeechGPT,为多模态LLM指明方向

大型语言模型(LLM)在各种自然语言处理任务上表现出惊人的能力。与此同时,多模态大型语言模型,如 G....
的头像 深度学习自然语言处理 发表于 05-22 14:38 692次阅读
邱锡鹏团队提出具有内生跨模态能力的SpeechGPT,为多模态LLM指明方向

基于统计频率的 baseline 方法

场景图是一种结构表示,它将图片中的对象表示为节点,并将它们的关系表示为边。
的头像 深度学习自然语言处理 发表于 05-22 10:35 393次阅读
基于统计频率的 baseline 方法

LLM底座模型:LLaMA、Palm、GLM、BLOOM、GPT结构对比

使用RMSNorm(即Root Mean square Layer Normalization)对输....
的头像 深度学习自然语言处理 发表于 05-19 17:03 4023次阅读
LLM底座模型:LLaMA、Palm、GLM、BLOOM、GPT结构对比

国内大模型争霸赛,你最看好哪家?

而最近,中文通用大模型基准(SuperCLUE)评测公布了最新结果,GPT-4 遥遥领先,而国内成绩....
的头像 深度学习自然语言处理 发表于 05-19 16:55 3988次阅读
国内大模型争霸赛,你最看好哪家?

WebCPM:首个联网支持中文问答开源模型

WebCPM 是面壁智能自研大模型工具学习引擎 BMTools 的首个成功实践,其特点在于其信息检索....
的头像 深度学习自然语言处理 发表于 05-18 14:37 687次阅读
WebCPM:首个联网支持中文问答开源模型

如何使用FasterTransformer进行单机及分布式模型推理

最近几个月,随着ChatGPT的现象级表现,大模型如雨后春笋般涌现。而模型推理是抽象的算法模型触达具....
的头像 深度学习自然语言处理 发表于 05-18 14:35 2585次阅读
如何使用FasterTransformer进行单机及分布式模型推理

中科院针对NL2Code任务,调研了27个大模型,并指出5个重要挑战

关于NL2Code的发展,其实和自然语言理解的发展类似,一开始,基本都是基于专家规则进行算法设计,但....
的头像 深度学习自然语言处理 发表于 05-18 14:33 1192次阅读
中科院针对NL2Code任务,调研了27个大模型,并指出5个重要挑战

浅析推理加速引擎FasterTransformer

最近几个月,随着ChatGPT的现象级表现,大模型如雨后春笋般涌现。而模型推理是抽象的算法模型触达具....
的头像 深度学习自然语言处理 发表于 05-18 14:32 2560次阅读
浅析推理加速引擎FasterTransformer

基于自监督逻辑归纳的模糊时序推理框架LECTER

理解自然语言中与事件相交织的时间概念是理解事件演化的重要内容。人可以具有对事件的典型发生时间、发生频....
的头像 深度学习自然语言处理 发表于 05-17 16:07 705次阅读
基于自监督逻辑归纳的模糊时序推理框架LECTER

如何利用LLM做一些多模态任务

本文整理了近两年来基于LLM做vision-lanuage任务的一些工作,并将其划分为4个类别:
的头像 深度学习自然语言处理 发表于 05-17 15:02 872次阅读
如何利用LLM做一些多模态任务