搜索历史

清空

搜索热词

0

聊天消息
系统消息
评论与回复

查看更多

查看更多

查看更多

VIP于到期续费

登录后你可以

下载海量资料
学习在线课程
观看技术视频
写文章/发帖/加入社区

会员中心

创作中心

发布

创作活动

完善资料让更多小伙伴认识你，还能领取20积分哦，立即完善>

3天内不再提示

深度学习自然语言处理

关注

文章：837 被阅读：213.5w 粉丝数：43 关注数：0 点赞数：5

大模型如何快速构建指令遵循数据集？

构造instruction data非常耗时耗力，常受限于质量，多样性，创造性，阻碍了instruc....

的头像

深度学习自然语言处理发表于 06-27 16:52 •3003次阅读

大模型如何快速构建指令遵循数据集？

GLoRA—高效微调模型参数

近年来，大规模深度神经网络的显著成就彻底改变了人工智能领域，在各种任务和领域展示了前所未有的性能。

的头像

深度学习自然语言处理发表于 06-27 16:47 •879次阅读

面向结构化数据的文本生成技术研究

今天我们要讲的文本生成是现在最流行的研究领域之一。文本生成的目标是让计算机像人类一样学会表达，目前看....

的头像

深度学习自然语言处理发表于 06-26 14:39 •674次阅读

面向结构化数据的文本生成技术研究

ChatGLM2-6B：性能大幅提升，8-32k上下文，推理提速42%，在中文榜单位列榜首

在主要评估LLM模型中文能力的 C-Eval 榜单中，截至6月25日 ChatGLM2 模型以 71....

的头像

深度学习自然语言处理发表于 06-26 14:30 •1047次阅读

ChatGLM2-6B：性能大幅提升，8-32k上下文，推理提速42%，在中文榜单位列榜首

神经编码器-解码器模型的历史

基于 transformer 的编码器-解码器模型是表征学习和模型架构这两个领域多年研究成果....

的头像

深度学习自然语言处理发表于 06-20 15:42 •942次阅读

基准数据集(CORR2CAUSE)如何测试大语言模型(LLM)的纯因果推理能力

因果推理是人类智力的标志之一。因果关系NLP领域近年来引起了人们的极大兴趣，但其主要依赖于从常识....

的头像

深度学习自然语言处理发表于 06-20 15:39 •1898次阅读

基准数据集(CORR2CAUSE)如何测试大语言模型(LLM)的纯因果推理能力

RLHF实践中的框架使用与一些坑 (TRL, LMFlow)

我们主要用一个具体的例子展示如何在两个框架下做RLHF，并且记录下训练过程中我们踩到的主要的坑。这个....

的头像

深度学习自然语言处理发表于 06-20 14:36 •2016次阅读

RLHF实践中的框架使用与一些坑 (TRL, LMFlow)

GPT-Engineer一夜爆火！一个提示生成整个代码库，GitHub狂飙19k星

网友表示，「澄清问题」是真正使GPT-Engineer脱颖而出的原因，因为修复生成代码中的问题往往比....

的头像

深度学习自然语言处理发表于 06-20 14:34 •617次阅读

GPT-Engineer一夜爆火！一个提示生成整个代码库，GitHub狂飙19k星

基于多任务预训练模块化提示

Prompt Tuning 可以让预训练的语言模型快速适应下游任务。虽然有研究证明：当训练数据足够多....

的头像

深度学习自然语言处理发表于 06-20 11:04 •720次阅读

智能开源大模型baichuan-7B技术改进

baichuan-7B 主要是参考LLaMA进行的改进，且模型架构与LLaMA一致。而在开源大模型中....

的头像

深度学习自然语言处理发表于 06-17 14:14 •1093次阅读

分析自动评测器的工具包

除了各类开源模型外，还有GPT-4、PaLM 2等众多「闭源」模型，甚至还开设了一个「准中文」排行榜....

的头像

深度学习自然语言处理发表于 06-17 14:11 •575次阅读

基于 Transformers 的编码器-解码器模型

基于 transformer 的编码器-解码器模型是表征学习和模型架构这两个领域多年研究成果....

的头像

深度学习自然语言处理发表于 06-16 16:53 •947次阅读

基于 Transformers 的编码器-解码器模型

LLM in Medical Domain: 一文速览大语言模型在医学领域的应用

由于在生成长文本的数据集上，Flan-PaLM和临床医生的结果显示出一定gap。本文提出了使用Ins....

的头像

深度学习自然语言处理发表于 06-15 18:00 •1774次阅读

LLM in Medical Domain: 一文速览大语言模型在医学领域的应用

王小川大模型首亮相！70亿参数霸榜，清北抢先用

AGIEval评测基准由微软研究院发起，旨在全面评估基础模型在人类认知和问题解决相关任务上的能力，包....

的头像

深度学习自然语言处理发表于 06-15 17:56 •749次阅读

王小川大模型首亮相！70亿参数霸榜，清北抢先用

梁宁：为什么中国没有像ChatGPT和Vision Pro这样的创新产品？

相隔 20 多年的时间再回头看，我比较得意的一件事就是，1996 年我给联想的总裁办做了一次汇报，说....

的头像

深度学习自然语言处理发表于 06-15 17:04 •1280次阅读

ChatGPT的潜力和局限

今天为大家分享一篇研究，当ChatGPT穿越到口袋妖怪世界，是否会理解并应用这个虚构世界的知识呢....

的头像

深度学习自然语言处理发表于 06-13 17:23 •607次阅读

为k近邻机器翻译领域自适应构建可解释知识库

为了找到NMT模型的潜在缺陷，构建更加可解释的知识库，我们提出以局部准确性这一新概念作为分析角度。其....

的头像

深度学习自然语言处理发表于 06-13 15:25 •722次阅读

为k近邻机器翻译领域自适应构建可解释知识库

大模型参数高效微调技术原理综述

神经网络包含很多全连接层，其借助于矩阵乘法得以实现，然而，很多全连接层的权重矩阵都是满秩的。

的头像

深度学习自然语言处理发表于 06-13 14:59 •2444次阅读

大模型参数高效微调技术原理综述

能遵循instruction的句向量模型

句向量技术是将连续的文本转化为固定长度的稠密向量，将句子映射到同一个向量空间中

的头像

深度学习自然语言处理发表于 06-13 14:56 •995次阅读

能遵循instruction的句向量模型

基于 RNN 的解码器架构如何建模

Vaswani 等人在其名作 Attention is all you need 中首创了基于....

的头像

深度学习自然语言处理发表于 06-12 17:08 •871次阅读

基于 RNN 的解码器架构如何建模

Meta开源文本如何生成音乐大模型

年初，谷歌推出了音乐生成大模型 MusicLM，效果非常不错。有人称这比大火的 ChatGPT 还重....

的头像

深度学习自然语言处理发表于 06-12 15:11 •958次阅读

Meta开源文本如何生成音乐大模型

如何将ChatGPT的能力蒸馏到另一个大模型

如何将ChatGPT的能力蒸馏到另一个大模型，是当前许多大模型研发的研发范式。当前许多模型都是采用c....

的头像

深度学习自然语言处理发表于 06-12 15:06 •1145次阅读

如何将ChatGPT的能力蒸馏到另一个大模型

In-Context-Learning在更大的语言模型上表现不同

最近，在语言模型领域取得了巨大的进展，部分是因为它们可以通过In-Context- Learning....

的头像

深度学习自然语言处理发表于 06-12 14:35 •754次阅读

In-Context-Learning在更大的语言模型上表现不同

Allen AI推出集成主流大语言模型的LLM-BLENDER框架

在推理阶段，计算一个矩阵，该矩阵包含表示成对比较结果的logits。给定该矩阵，可以推断给定输入x的....

的头像

深度学习自然语言处理发表于 06-11 15:06 •787次阅读

Allen AI推出集成主流大语言模型的LLM-BLENDER框架

使用单卡高效微调bloom-7b1，效果惊艳

在本文中我们将对QLoRA的基本原理进行介绍，并且在Firefly项目中进行实践。我们在bloom-....

的头像

深度学习自然语言处理发表于 06-08 15:19 •2106次阅读

使用单卡高效微调bloom-7b1，效果惊艳

性能媲美同时成本降低98%，斯坦福提出FrugalGPT，研究却惹争议

这项研究提出的思想和发现为可持续高效地使用 LLM 奠定了基础。如果能够在不增加预算的情况下采用更高....

的头像

深度学习自然语言处理发表于 06-08 15:11 •498次阅读

性能媲美同时成本降低98%，斯坦福提出FrugalGPT，研究却惹争议

Transformer结构及其应用详解

本文首先详细介绍Transformer的基本结构，然后再通过GPT、BERT、MT-DNN以及GPT....

的头像

深度学习自然语言处理发表于 06-08 09:56 •2129次阅读

Transformer结构及其应用详解

从大模型中蒸馏脚本知识用于约束语言规划

为了实现日常目标，人们通常会根据逐步指令来计划自己的行动。这些指令被发现是目标导向的脚本，包括一组达....

的头像

深度学习自然语言处理发表于 06-08 09:46 •1187次阅读

从大模型中蒸馏脚本知识用于约束语言规划

LLM时代NLP研究何去何从？

在当前低资源的语言基准上（如FLORES-200）改进机器翻译性能。针对资源极低的语言，可以利用圣经....

的头像

深度学习自然语言处理发表于 06-02 15:52 •999次阅读

iPhone都能微调大模型了嘛

自动测试分数达到 ChatGPT的99.3%，人类难以分辨两者的回答…… 这是开源大模型最新成果，....

的头像

深度学习自然语言处理发表于 06-02 15:26 •736次阅读

iPhone都能微调大模型了嘛

上一页 1 2 3 4 567 8 9 10 11 28 下一页