0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ToolLLM:促进大型语言模型掌握16000+真实世界的APIs

深度学习自然语言处理 来源:深度学习自然语言处理 2023-08-02 16:27 次阅读

为了促进开源LLMs的工具使用能力,作者引入了 ToolLLM,这是一个数据构建、模型训练和评估的通用工具使用框架。

4885e696-3076-11ee-9e74-dac502259ad0.png

论文:ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs
地址:https://arxiv.org/abs/2307.16789
项目:https://github.com/OpenBMB/ToolBench
单位:清华、人大、耶鲁、微信、腾讯、知乎

尽管开源大语言模型 (LLM) 及其变体(例如 LLaMA 和 Vicuna)取得了进步,但它们在执行更高级别的任务方面仍然受到很大限制,例如遵循人类指令使用外部工具 (API)。

这是因为当前的指令调优主要集中在基本语言任务而不是工具使用领域。

这与最先进 (SOTA) 的LLMs(例如 ChatGPT)形成鲜明对比,后者展示了出色的工具使用能力,但不幸的是闭源的。

48b7033e-3076-11ee-9e74-dac502259ad0.png

为了促进开源LLMs的工具使用能力,我们引入了 ToolLLM,这是一个数据构建、模型训练和评估的通用工具使用框架。

我们首先介绍 ToolBench,这是一个供工具使用的指令调整数据集,它是使用 ChatGPT 自动创建的。

具体来说,我们从 RapidAPI Hub 收集了 16,464 个真实世界的 RESTful API,涵盖 49 个类别,然后提示 ChatGPT 生成涉及这些 API 的各种人工指令,涵盖单工具和多工具场景。

48de00c4-3076-11ee-9e74-dac502259ad0.png

最后,我们使用 ChatGPT 为每条指令搜索有效的解决方案路径(API 调用链)。

为了使搜索过程更加高效,我们开发了一种新颖的基于深度优先搜索的决策树(DFSDT),使LLMs能够评估多个推理轨迹并扩展搜索空间。我们证明 DFSDT 显着增强了LLMs的规划和推理能力。

4942a056-3076-11ee-9e74-dac502259ad0.png

为了有效评估工具使用情况,我们开发了一个自动评估器:ToolEval

4969e40e-3076-11ee-9e74-dac502259ad0.png49874cce-3076-11ee-9e74-dac502259ad0.png

我们在ToolBench上微调LLaMA并获得ToolLLaMA

49a2fed8-3076-11ee-9e74-dac502259ad0.png

我们的 ToolEval 表明 ToolLLaMA 表现出执行复杂指令和泛化到未见过的 API 的卓越能力,并且表现出与 ChatGPT 相当的性能。

49cd61f0-3076-11ee-9e74-dac502259ad0.png

为了使管道更加实用,我们设计了一个神经 API 检索器来为每条指令推荐合适的 API,从而无需手动选择 API。

49f19782-3076-11ee-9e74-dac502259ad0.png



声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6854

    浏览量

    88778
  • 开源
    +关注

    关注

    3

    文章

    3235

    浏览量

    42365
  • 语言模型
    +关注

    关注

    0

    文章

    502

    浏览量

    10241

原文标题:刘知远等众多机构提出ToolLLM:促进大型语言模型掌握16000+真实世界的APIs

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    大型语言模型在关键任务和实际应用中的挑战

    大型语言模型的出现极大地推动了自然语言处理领域的进步,但同时也存在一些局限性,比如模型可能会产生看似合理但实际上是错误或虚假的内容,这一现象
    的头像 发表于 08-15 09:33 1441次阅读
    <b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>在关键任务和实际应用中的挑战

    探索高效的大型语言模型大型语言模型的高效学习方法

    大型语言模型(LLMs)的应用中,提示工程(Prompt Engineering)是一种关键技术,用于引导模型生成特定输出或执行特定任务。通过精心设计的提示,可以显著提高LLMs的性
    发表于 12-13 14:21 562次阅读
    探索高效的<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>!<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>的高效学习方法

    【大语言模型:原理与工程实践】揭开大语言模型的面纱

    。 大语言模型的缩放定律对于深度学习研究和应用具有重要意义。它提供了更强大的泛化能力和适应性,使得模型能够更好地处理现实世界中的复杂任务和不确定性问题。同时,缩放定律也
    发表于 05-04 23:55

    【大语言模型:原理与工程实践】大语言模型的基础技术

    之后,成为文本建模领域的热门架构。不仅如此,它还对自然语言处理领域产生了深远的影响。基于Transformer的预训练模型,如GPT系列和BERT系列,已在多种任务上取得了卓越的成绩。目前的大型
    发表于 05-05 12:17

    【大语言模型:原理与工程实践】大语言模型的评测

    ,例如将中文诗句“独在异乡为异客,每逢佳节倍思亲”翻译成英文。其次,多语言能力则评估模型对不同国家和地区语言掌握程度,如将“我要出去吃晚饭”翻译成日语。针对翻译类评测任务,我们主要关
    发表于 05-07 17:12

    【大语言模型:原理与工程实践】大语言模型的应用

    和微调的积累,无需额外知识。然而,大模型掌握世界知识具有时效性,对于训练后发生的事件或训练集中未涵盖的知识,大语言模型往往无法应对。当面
    发表于 05-07 17:21

    KT利用NVIDIA AI平台训练大型语言模型

    韩国先进的移动运营商构建包含数百亿个参数的大型语言模型,并使用 NVIDIA DGX SuperPOD 平台和 NeMo Megatron 框架训练该模型
    的头像 发表于 09-27 09:24 1153次阅读

    NVIDIA AI平台为大型语言模型带来巨大收益

    随着大型语言模型( LLM )的规模和复杂性不断增长, NVIDIA 今天宣布更新 NeMo Megatron 框架,提供高达 30% 的训练速度。
    的头像 发表于 10-10 15:39 858次阅读
    NVIDIA AI平台为<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>带来巨大收益

    大型语言模型有哪些用途?

    大型语言模型能识别、总结、翻译、预测和生成文本及其他内容。 AI 应用在大型语言模型的帮助下,可
    的头像 发表于 02-23 19:50 5098次阅读

    大型语言模型有哪些用途?大型语言模型如何运作呢?

    大型语言模型能识别、总结、翻译、预测和生成文本及其他内容。
    的头像 发表于 03-08 13:57 7866次阅读

    浅析AI大型语言模型研究的发展历程

    大型语言模型研究的发展有三条技术路线:Bert 模式、GPT 模式、混合模式。其中国内大多采用混合模式, 多数主流大型语言
    发表于 06-09 12:34 5074次阅读
    浅析AI<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>研究的发展历程

    基于Transformer的大型语言模型(LLM)的内部机制

    本文旨在更好地理解基于 Transformer 的大型语言模型(LLM)的内部机制,以提高它们的可靠性和可解释性。 随着大型语言
    的头像 发表于 06-25 15:08 1407次阅读
    基于Transformer的<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>(LLM)的内部机制

    大型语言模型的应用

       大型语言模型(LLM) 是一种深度学习算法,可以通过大规模数据集训练来学习识别、总结、翻译、预测和生成文本及其他内容。大语言模型(LL
    的头像 发表于 07-05 10:27 2036次阅读

    大规模语言模型的基本概念、发展历程和构建流程

    使用自然语言与系统交互,从而实现包括问答、分类、摘要、翻译、聊天等从理解到生成的各种任务。大型语言模型展现出了强大的对世界知识
    的头像 发表于 12-07 11:40 3675次阅读
    大规模<b class='flag-5'>语言</b><b class='flag-5'>模型</b>的基本概念、发展历程和构建流程

    如何利用大型语言模型驱动的搜索为公司创造价值

    大型语言模型LLMs具有自动化内容创建、提高内容质量及多样化的潜力,可重塑企业与信息的交互方式。通过利用LLMs,企业能提升工作效率,降低运营成本,并获得深入洞察。来自EgeGürdeniz
    的头像 发表于 10-13 08:07 119次阅读
    如何利用<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>驱动的搜索为公司创造价值