搜索历史

清空

搜索热词

0

聊天消息
系统消息
评论与回复

查看更多

查看更多

查看更多

VIP于到期续费

登录后你可以

下载海量资料
学习在线课程
观看技术视频
写文章/发帖/加入社区

会员中心

创作中心

发布

创作活动

完善资料让更多小伙伴认识你，还能领取20积分哦，立即完善>

3天内不再提示

深度学习自然语言处理

关注

文章：837 被阅读：217.3w 粉丝数：43 关注数：0 点赞数：5

一个通用的自适应prompt方法，突破了零样本学习的瓶颈

为了解决这个问题，这篇研究提出了一种Universal Self-adaptive Promptin....

的头像

深度学习自然语言处理发表于 06-01 14:48 •876次阅读

一个通用的自适应prompt方法，突破了零样本学习的瓶颈

探索ChatGPT的信息抽取能力

通过人工检查ChatGPT的回复，发现ChatGPT倾向于识别比标注的跨度更长的sapn，以更接近人....

的头像

深度学习自然语言处理发表于 06-01 14:45 •1217次阅读

探索ChatGPT的信息抽取能力

State of GPT：大神Andrej揭秘OpenAI大模型原理和训练过程

你可以看到，Llama 的参数数量大概是 650 亿。现在，尽管与 GPT3 的 1750 亿个参数....

的头像

深度学习自然语言处理发表于 05-30 14:34 •1137次阅读

State of GPT：大神Andrej揭秘OpenAI大模型原理和训练过程

和ChatGPT相关的所有评估可能都不做数了！

不幸的是，我们对 ChatGPT 和许多其他封闭式 LM 背后的细节几乎一无所知：架构、epoch、....

的头像

深度学习自然语言处理发表于 05-30 14:30 •636次阅读

和ChatGPT相关的所有评估可能都不做数了！

LLM在各种情感分析任务中的表现如何

最近几年，GPT-3、PaLM和GPT-4等LLM刷爆了各种NLP任务，特别是在zero-sho....

的头像

深度学习自然语言处理发表于 05-29 17:24 •2487次阅读

LLM在各种情感分析任务中的表现如何

大模型LLM领域，有哪些可以作为学术研究方向？

随着全球大炼模型不断积累的丰富经验数据，人们发现大模型呈现出很多与以往统计学习模型、深度学习模型、甚....

的头像

深度学习自然语言处理发表于 05-29 14:36 •1243次阅读

大模型LLM领域，有哪些可以作为学术研究方向？

ETH提出RecurrentGPT实现交互式超长文本生成

RecurrentGPT 则另辟蹊径，是利用大语言模型进行交互式长文本生成的首个成功实践。它利用 C....

的头像

深度学习自然语言处理发表于 05-29 14:34 •928次阅读

ETH提出RecurrentGPT实现交互式超长文本生成

ChatGPT背后的大模型技术

由于ChatGPT可以适用于非常多的任务，很多人认为 AI 已经迎来拐点。李开复将此前的 AI 定义....

的头像

深度学习自然语言处理发表于 05-29 11:16 •1575次阅读

ChatGPT背后的大模型技术

调教LLaMA类模型没那么难，LoRA将模型微调缩减到几小时

最近几个月，ChatGPT 等一系列大语言模型（LLM）相继出现，随之而来的是算力紧缺日益严重。虽然....

的头像

深度学习自然语言处理发表于 05-28 10:58 •2833次阅读

调教LLaMA类模型没那么难，LoRA将模型微调缩减到几小时

“AI教父”Geoffrey Hinton：智能进化的下一个阶段

十年来，人工智能领域的众多惊人突破背后都离不开深度学习，它是使得ChatGPT、AlphaGo等得以....

的头像

深度学习自然语言处理发表于 05-26 15:16 •667次阅读

大型语言模型能否捕捉到它们所处理和生成的文本中的语义信息

大型语言模型能否捕捉到它们所处理和生成的文本中的语义信息？这一问题在计算机科学和自然语言处理领域....

的头像

深度学习自然语言处理发表于 05-25 11:34 •790次阅读

大型语言模型能否捕捉到它们所处理和生成的文本中的语义信息

基于实体和动作时空建模的视频文本预训练

摘要尽管常见的大规模视频-文本预训练模型已经在很多下游任务取得不错的效果，现有的模型通常将视频或者....

的头像

深度学习自然语言处理发表于 05-25 11:29 •840次阅读

基于实体和动作时空建模的视频文本预训练

硬件算法协同设计

在本文中，将探讨了transformer高效训练方法，从存储效率、硬件算法协同设计和计算效率三个角度....

的头像

深度学习自然语言处理发表于 05-25 10:33 •1080次阅读

上交清华提出中文大模型的知识评估基准C-Eval，辅助模型开发而非打榜

首先，把一个模型调成一个对话机器人这件事情并不难，开源界已经有了类似于 Alpaca, Vicuna....

的头像

深度学习自然语言处理发表于 05-24 15:03 •904次阅读

上交清华提出中文大模型的知识评估基准C-Eval，辅助模型开发而非打榜

Meta AI重磅推出LIMA！媲美GPT-4、无需RLHF就能对齐！

天下人苦“对齐”久矣！要让预训练语言模型的响应和特定任务和用户偏好对齐，动辄需要百万示例数据集上的i....

的头像

深度学习自然语言处理发表于 05-24 15:00 •1198次阅读

Meta AI重磅推出LIMA！媲美GPT-4、无需RLHF就能对齐！

大模型在不同任务中的优缺点

如果自己是一个大模型的小白，第一眼看到 GPT、PaLm、LLaMA 这些单词的怪异组合会作何感想？....

的头像

深度学习自然语言处理发表于 05-23 17:19 •4244次阅读

模型表现方面有意思的成果

若干年前，AlphaGo Zero用两个AI代理切磋围棋技艺，打败了人类。今早，符尧的一篇论文刷新了....

的头像

深度学习自然语言处理发表于 05-23 14:55 •508次阅读

如何对挑选出的demonstration示例进行排序

在demonstration selection的方法中，其中有部分方法也考虑到demonstrat....

的头像

深度学习自然语言处理发表于 05-23 14:51 •645次阅读

如何对挑选出的demonstration示例进行排序

LLM性能的主要因素

现在是2023年5月，截止目前，网络上已经开源了众多的LLM，如何用较低的成本，判断LLM的基础性能....

的头像

深度学习自然语言处理发表于 05-22 15:26 •1874次阅读

GPT-4 的模型结构和训练方法

在 GPT-4 的发布报道上，GPT-4 的多模态能力让人印象深刻，它可以理解图片内容给出图片描述，....

的头像

深度学习自然语言处理发表于 05-22 15:21 •2762次阅读

GPT-4 的模型结构和训练方法

邱锡鹏团队提出具有内生跨模态能力的SpeechGPT，为多模态LLM指明方向

大型语言模型（LLM）在各种自然语言处理任务上表现出惊人的能力。与此同时，多模态大型语言模型，如 G....

的头像

深度学习自然语言处理发表于 05-22 14:38 •749次阅读

邱锡鹏团队提出具有内生跨模态能力的SpeechGPT，为多模态LLM指明方向

基于统计频率的 baseline 方法

场景图是一种结构表示，它将图片中的对象表示为节点，并将它们的关系表示为边。

的头像

深度学习自然语言处理发表于 05-22 10:35 •447次阅读

基于统计频率的 baseline 方法

LLM底座模型：LLaMA、Palm、GLM、BLOOM、GPT结构对比

使用RMSNorm（即Root Mean square Layer Normalization）对输....

的头像

深度学习自然语言处理发表于 05-19 17:03 •4211次阅读

LLM底座模型：LLaMA、Palm、GLM、BLOOM、GPT结构对比

国内大模型争霸赛，你最看好哪家？

而最近，中文通用大模型基准（SuperCLUE）评测公布了最新结果，GPT-4 遥遥领先，而国内成绩....

的头像

深度学习自然语言处理发表于 05-19 16:55 •4081次阅读

国内大模型争霸赛，你最看好哪家？

WebCPM：首个联网支持中文问答开源模型

WebCPM 是面壁智能自研大模型工具学习引擎 BMTools 的首个成功实践，其特点在于其信息检索....

的头像

深度学习自然语言处理发表于 05-18 14:37 •794次阅读

WebCPM：首个联网支持中文问答开源模型

如何使用FasterTransformer进行单机及分布式模型推理

最近几个月，随着ChatGPT的现象级表现，大模型如雨后春笋般涌现。而模型推理是抽象的算法模型触达具....

的头像

深度学习自然语言处理发表于 05-18 14:35 •2714次阅读

如何使用FasterTransformer进行单机及分布式模型推理

中科院针对NL2Code任务，调研了27个大模型，并指出5个重要挑战

关于NL2Code的发展，其实和自然语言理解的发展类似，一开始，基本都是基于专家规则进行算法设计，但....

的头像

深度学习自然语言处理发表于 05-18 14:33 •1321次阅读

中科院针对NL2Code任务，调研了27个大模型，并指出5个重要挑战

浅析推理加速引擎FasterTransformer

最近几个月，随着ChatGPT的现象级表现，大模型如雨后春笋般涌现。而模型推理是抽象的算法模型触达具....

的头像

深度学习自然语言处理发表于 05-18 14:32 •2655次阅读

浅析推理加速引擎FasterTransformer

基于自监督逻辑归纳的模糊时序推理框架LECTER

理解自然语言中与事件相交织的时间概念是理解事件演化的重要内容。人可以具有对事件的典型发生时间、发生频....

的头像

深度学习自然语言处理发表于 05-17 16:07 •817次阅读

基于自监督逻辑归纳的模糊时序推理框架LECTER

如何利用LLM做一些多模态任务

本文整理了近两年来基于LLM做vision-lanuage任务的一些工作，并将其划分为4个类别：

的头像

深度学习自然语言处理发表于 05-17 15:02 •953次阅读

如何利用LLM做一些多模态任务

上一页 2 3 4 5 678 9 10 11 12 28 下一页