ToolLLM：促进大型语言模型掌握16000+真实世界的APIs-电子发烧友网

为了促进开源LLMs的工具使用能力，作者引入了 ToolLLM，这是一个数据构建、模型训练和评估的通用工具使用框架。

论文：ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs
地址：https://arxiv.org/abs/2307.16789
项目：https://github.com/OpenBMB/ToolBench
单位：清华、人大、耶鲁、微信、腾讯、知乎

尽管开源大语言模型 (LLM) 及其变体（例如 LLaMA 和 Vicuna）取得了进步，但它们在执行更高级别的任务方面仍然受到很大限制，例如遵循人类指令使用外部工具 (API)。

这是因为当前的指令调优主要集中在基本语言任务而不是工具使用领域。

这与最先进 (SOTA) 的LLMs（例如 ChatGPT）形成鲜明对比，后者展示了出色的工具使用能力，但不幸的是闭源的。

为了促进开源LLMs的工具使用能力，我们引入了 ToolLLM，这是一个数据构建、模型训练和评估的通用工具使用框架。

我们首先介绍 ToolBench，这是一个供工具使用的指令调整数据集，它是使用 ChatGPT 自动创建的。

具体来说，我们从 RapidAPI Hub 收集了 16,464 个真实世界的 RESTful API，涵盖 49 个类别，然后提示 ChatGPT 生成涉及这些 API 的各种人工指令，涵盖单工具和多工具场景。

最后，我们使用 ChatGPT 为每条指令搜索有效的解决方案路径（API 调用链）。

为了使搜索过程更加高效，我们开发了一种新颖的基于深度优先搜索的决策树（DFSDT），使LLMs能够评估多个推理轨迹并扩展搜索空间。我们证明 DFSDT 显着增强了LLMs的规划和推理能力。

为了有效评估工具使用情况，我们开发了一个自动评估器：ToolEval。

我们在ToolBench上微调LLaMA并获得ToolLLaMA。

我们的 ToolEval 表明 ToolLLaMA 表现出执行复杂指令和泛化到未见过的 API 的卓越能力，并且表现出与 ChatGPT 相当的性能。

为了使管道更加实用，我们设计了一个神经 API 检索器来为每条指令推荐合适的 API，从而无需手动选择 API。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

数据

数据

+关注

关注
8

文章
7220

浏览量
89940
开源

开源

+关注

关注
3

文章
3442

浏览量
42830
语言模型

语言模型

+关注

关注
0

文章
547

浏览量
10369

原文标题：刘知远等众多机构提出ToolLLM：促进大型语言模型掌握16000+真实世界的APIs

文章出处：【微信号：zenRRan，微信公众号：深度学习自然语言处理】欢迎添加关注！文章转载请注明出处。

大型语言模型在关键任务和实际应用中的挑战

大型语言模型的出现极大地推动了自然语言处理领域的进步，但同时也存在一些局限性，比如模型可能会产生看似合理但实际上是错误或虚假的内容，这一现象

发表于 08-15 09:33 •1612次阅读

<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>在关键任务和实际应用中的挑战

探索高效的大型语言模型！大型语言模型的高效学习方法

在大型语言模型（LLMs）的应用中，提示工程（Prompt Engineering）是一种关键技术，用于引导模型生成特定输出或执行特定任务。通过精心设计的提示，可以显著提高LLMs的性

发表于 12-13 14:21 •713次阅读

探索高效的<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>！<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>的高效学习方法

【大语言模型：原理与工程实践】揭开大语言模型的面纱

。大语言模型的缩放定律对于深度学习研究和应用具有重要意义。它提供了更强大的泛化能力和适应性，使得模型能够更好地处理现实世界中的复杂任务和不确定性问题。同时，缩放定律也

发表于 05-04 23:55

【大语言模型：原理与工程实践】大语言模型的基础技术

之后，成为文本建模领域的热门架构。不仅如此，它还对自然语言处理领域产生了深远的影响。基于Transformer的预训练模型，如GPT系列和BERT系列，已在多种任务上取得了卓越的成绩。目前的大型

发表于 05-05 12:17

【大语言模型：原理与工程实践】大语言模型的应用

和微调的积累，无需额外知识。然而，大模型所掌握的世界知识具有时效性，对于训练后发生的事件或训练集中未涵盖的知识，大语言模型往往无法应对。当面

发表于 05-07 17:21

KT利用NVIDIA AI平台训练大型语言模型

韩国先进的移动运营商构建包含数百亿个参数的大型语言模型，并使用 NVIDIA DGX SuperPOD 平台和 NeMo Megatron 框架训练该模型。

发表于 09-27 09:24 •1297次阅读

NVIDIA AI平台为大型语言模型带来巨大收益

随着大型语言模型（ LLM ）的规模和复杂性不断增长， NVIDIA 今天宣布更新 NeMo Megatron 框架，提供高达 30% 的训练速度。

发表于 10-10 15:39 •956次阅读

NVIDIA AI平台为<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>带来巨大收益

大型语言模型有哪些用途？

大型语言模型能识别、总结、翻译、预测和生成文本及其他内容。 AI 应用在大型语言模型的帮助下，可

发表于 02-23 19:50 •5313次阅读

大型语言模型有哪些用途？大型语言模型如何运作呢？

大型语言模型能识别、总结、翻译、预测和生成文本及其他内容。

发表于 03-08 13:57 •8222次阅读

浅析AI大型语言模型研究的发展历程

大型语言模型研究的发展有三条技术路线：Bert 模式、GPT 模式、混合模式。其中国内大多采用混合模式，多数主流大型语言

发表于 06-09 12:34 •5556次阅读

浅析AI<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>研究的发展历程

基于Transformer的大型语言模型（LLM）的内部机制

本文旨在更好地理解基于 Transformer 的大型语言模型（LLM）的内部机制，以提高它们的可靠性和可解释性。随着大型语言

发表于 06-25 15:08 •1600次阅读

基于Transformer的<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>（LLM）的内部机制

大型语言模型的应用

大型语言模型（LLM）是一种深度学习算法，可以通过大规模数据集训练来学习识别、总结、翻译、预测和生成文本及其他内容。大语言模型（LL

发表于 07-05 10:27 •2197次阅读

大规模语言模型的基本概念、发展历程和构建流程

使用自然语言与系统交互，从而实现包括问答、分类、摘要、翻译、聊天等从理解到生成的各种任务。大型语言模型展现出了强大的对世界知识

发表于 12-07 11:40 •4715次阅读

大规模<b class='flag-5'>语言</b><b class='flag-5'>模型</b>的基本概念、发展历程和构建流程

如何利用大型语言模型驱动的搜索为公司创造价值

大型语言模型LLMs具有自动化内容创建、提高内容质量及多样化的潜力，可重塑企业与信息的交互方式。通过利用LLMs，企业能提升工作效率，降低运营成本，并获得深入洞察。来自EgeGürdeniz

发表于 10-13 08:07 •244次阅读

如何利用<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>驱动的搜索为公司创造价值

大语言模型开发框架是什么

大语言模型开发框架是指用于训练、推理和部署大型语言模型的软件工具和库。下面，AI部落小编为您介绍大语言

发表于 12-06 10:28 •224次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

ToolLLM：促进大型语言模型掌握16000+真实世界的APIs

评论