优于10倍参数模型！微软发布Orca 2 LLM-电子发烧友网

微软发布 Orca 2 LLM，这是 Llama 2 的一个调优版本，性能与包含 10 倍参数的模型相当，甚至更好。Orca 2 使用了一个合成训练数据集和一项称为 Prompt Erasure（提示词擦除）的新技术来实现这一性能。

Orca 2 使用了师生模式的训练方案，其中一个较大、较强的 LLM 作为另一个较小的 LLM（学生）的老师，老师的目标是提升学生的性能，使其与更大模型的性能相媲美。微软的训练技术教会较小的模型多种推理技巧，并教其如何为特定任务选择最有效的技巧。

为此，老师被赋予了复杂的提示词来触发某种推理行为。不过，在一种被称为 Prompt Erasure 的方案中，学生只得到任务要求和期望的响应，而不是老师的提示词。在基准测试中，一个拥有 13B 参数的 Orca 2 模型的表现超过了一个 13B 参数的基准 Llama 2 模型，提升了 47.54%。而一个拥有 7B 参数的 Orca 2 模型在推理任务方面与一个拥有 70B 参数的 Llama 2 模型相当，甚至更好。

尽管像 ChatGPT 这样的 LLM 在给定少量提示词的情况下通常表现良好，但由于其内存和计算需求较大，托管这些模型极具有挑战性。经过调优的较小的模型也可以表现良好，许多研究人员已经在研究使用较大 LLM 生成的合成数据集对它们进行训练。

InfoQ 最近报道了谷歌的 Distilling Step-by-Step 方法，该方法会让老师 LLM 自动生成一个小型的调优数据集，其中包含输入和输出标签，以及为何选择输出标签的“基本原理”。InfoQ 还报道了 Stability AI 的 Stable Beluga 模型，它使用微软原始的 Orca 1 方案进行训练，该方案使用了 Explanation Tuning，其中老师 LLM 被提示“生成详细答案”。

与 Orca 1 类似，Orca 2 训练数据集是由老师 LLM 生成的，而老师 LLM 收到了详细的提示词。然而，微软新的训练方法 Cautious Reasoning 将训练任务与提示词相结合，引导老师 LLM 使用特定的问题解决策略，如“一步一步”或“解释你的答案”。然后在学生的训练过程中，老师的提示词被删除，这促使学生学会选择正确的策略。

为了评估这种方法，微软将 Orca 2 模型的性能与几个基准模型进行了比较，包括 Llama 2、ChatGPT（GPT-3.5）和 GPT-4。基准任务包括推理、语言理解、文本完成和摘要。在推理基准测试中，13B 参数 Orca 2 模型优于除 ChatGPT 和 GPT-4 之外的所有基准。他们还发现，给 Orca 2 一个“谨慎”的系统提示词（“你是一个谨慎的助手，你会仔细遵循指示”）相比无系统提示会略微提升其性能。

有几位用户在 X 上发表了关于 Orca 2 的帖子。一位用户指出：“你不需要用‘一步一步解释’这样的技巧来提示它。它自己知道。” AI 研究员 Rudi Ranck 写道：

许多绝妙的想法都很简单……就像 Orca 2 中的“提示词擦除”一样：完整的提示词不会呈现给模型，而只呈现任务和答案（它过滤了生成这些答案所使用的完整提示词）。这有助于模型在更高层次上制定策略。这是一篇非常好的论文。我强烈建议通读全文。

审核编辑：刘清

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

ChatGPT

ChatGPT

+关注

关注
29

文章
1566

浏览量
8010
LLM

LLM

+关注

关注
0

文章
298

浏览量
388

原文标题：微软发布 Orca 2 LLM，表现优于 10 倍参数模型

文章出处：【微信号：AI前线，微信公众号：AI前线】欢迎添加关注！文章转载请注明出处。

字节跳动发布豆包大模型1.5 Pro

3.5 Sonnet等模型。该模型采用大规模稀疏MoE架构，使用较小的激活参数进行预训练，却能等效7倍激活参数的Dense

发表于 01-23 10:24 •147次阅读

小白学大模型：构建LLM的关键步骤

随着大规模语言模型（LLM）在性能、成本和应用前景上的快速发展，越来越多的团队开始探索如何自主训练LLM模型。然而，是否从零开始训练一个LLM

发表于 01-09 12:12 •379次阅读

如何训练自己的LLM模型

训练自己的大型语言模型（LLM）是一个复杂且资源密集的过程，涉及到大量的数据、计算资源和专业知识。以下是训练LLM模型的一般步骤，以及一些关键考虑因素：定义目标和需求：确定你的

发表于 11-08 09:30 •756次阅读

请问InDTU IHDMP协议使用的CRC校验使用的什么参数模型？

InDTU IHDMP协议使用的CRC校验使用的什么参数模型？

发表于 07-25 06:39

LLM大模型推理加速的关键技术

LLM（大型语言模型）大模型推理加速是当前人工智能领域的一个研究热点，旨在提高模型在处理复杂任务时的效率和响应速度。以下是对LLM大

发表于 07-24 11:38 •996次阅读

大模型LLM与ChatGPT的技术原理

在人工智能领域，大模型（Large Language Model, LLM）和ChatGPT等自然语言处理技术（Natural Language Processing, NLP）正逐步改变着人类

发表于 07-10 10:38 •1009次阅读

llm模型本地部署有用吗

在当今的人工智能领域，LLM（Large Language Model，大型语言模型）已经成为了一种非常受欢迎的技术。它们在自然语言处理（NLP）任务中表现出色，如文本生成、翻译、摘要、问答等。然而

发表于 07-09 10:14 •606次阅读

llm模型有哪些格式

LLM（Large Language Model，大型语言模型）是一种深度学习模型，主要用于处理自然语言处理（NLP）任务。LLM模型的格式

发表于 07-09 09:59 •727次阅读

LLM模型和LMM模型的区别

LLM（线性混合模型）和LMM（线性混合效应模型）之间的区别如下：定义： LLM（线性混合模型）是一种统计

发表于 07-09 09:57 •1180次阅读

llm模型和chatGPT的区别

LLM（Large Language Model）是指大型语言模型，它们是一类使用深度学习技术构建的自然语言处理（NLP）模型。LLM模型可

发表于 07-09 09:55 •1293次阅读

LLM模型的应用领域

在本文中，我们将深入探讨LLM（Large Language Model，大型语言模型）的应用领域。LLM是一种基于深度学习的人工智能技术，它能够理解和生成自然语言文本。近年来，随着计算能力的提高

发表于 07-09 09:52 •703次阅读

大语言模型(LLM)快速理解

自2022年，ChatGPT发布之后，大语言模型（LargeLanguageModel），简称LLM掀起了一波狂潮。作为学习理解LLM的开始，先来整体理解一下大语言

发表于 06-04 08:27 •1105次阅读

微软自研5000亿参数大模型曝光

微软近日曝光了其内部正在秘密研发的巨型AI模型——MAl-1，这款模型拥有惊人的5000亿参数。据微软首席技术官Kevin Scott确认，

发表于 05-08 09:56 •483次阅读

NVIDIA加速微软最新的Phi-3 Mini开源语言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM 是一个开源库，用于优化从 PC 到云端的

发表于 04-28 10:36 •625次阅读

阿里云通义千问发布320亿参数模型，优化性能及效率

与之前的模型相比，新版320亿参数模型在性能、效率以及内存占用方面取得了明显改善。具体来说，32B在智能体场景下能力优于14B模型，并且推理成本较小。

发表于 04-08 14:44 •852次阅读

搜索历史

优于10倍参数模型！微软发布Orca 2 LLM

评论

字节跳动发布豆包大模型1.5 Pro

小白学大模型：构建LLM的关键步骤

如何训练自己的LLM模型

请问InDTU IHDMP协议使用的CRC校验使用的什么参数模型？

LLM大模型推理加速的关键技术

大模型LLM与ChatGPT的技术原理

llm模型本地部署有用吗

llm模型有哪些格式

LLM模型和LMM模型的区别

llm模型和chatGPT的区别

LLM模型的应用领域

大语言模型(LLM)快速理解

微软自研5000亿参数大模型曝光

NVIDIA加速微软最新的Phi-3 Mini开源语言模型

阿里云通义千问发布320亿参数模型，优化性能及效率