中文信息处理实验室提出工具学习新框架ToolAlpaca-电子发烧友网

如何让小规模语言模型像 GPT-4 一样使用任意工具是一个非常有价值的研究课题。中国科学院软件研究所中文信息处理实验室提出了一种语言模型的工具学习新框架，该框架利用基于大模型的多智能体模拟交互策略，可以自动生成多样化的工具使用数据集，并使用生成的数据集对小模型进行微调。论文的实验验证了仅需要使用三千多个多样化的工具调用实例，就能够使小型模型获得与极大规模模型相媲美的通用工具使用能力。

具体来说，本文的核心工作包括：

1. 提出一种基于大模型的多智能体模拟交互策略，用于生成工具使用数据集。这种方法能在最小化人工干预的前提下，生成大量且多样化的工具使用数据集；

2. 开源了一个涵盖超过400个工具，三千多条实例的模拟工具使用数据集，为探索通用工具使用能力奠定了基础；

3. 通过实验，验证了在多样化工具使用数据集上进行微调，能够使小型模型获得与极大规模模型相媲美的通用工具使用能力。

论文：ToolAlpaca: Generalized Tool Learning for Language Models with 3000 Simulated Cases

数据：https://github.com/tangqiaoyu/ToolAlpaca

背景工具的使用在人类进化史上占据了重要的地位，对于语言模型来说，这一点同样适用。当语言模型能够熟练运用各种工具，它们就能突破自身的局限，获取最新的信息，帮助用户利用各种服务，并提升回答的精确性。如今，OpenAI 的 GPT-4 已经可以通过插件的形式接入和使用各种第三方工具，同时这类超大型的语言模型支持通过仅给定配置文件的情况下，以即插即用的方式使用之前模型训练过程中未见过的工具，这一泛化性的工具使用能力大大丰富了模型调动资源解决复杂问题的手段。然而，对于较小的语言模型，例如 Moss、ToolLLaMA 等，它们使用工具的能力仍然来源于在特定工具的数据集上进行监督学习。这使得这些模型的工具使用能力受限于在训练过程中接触过的工具，尚未真正获得通用的工具使用能力。上述的对比引出了研究人员所关注的一个核心研究问题，即是否有可能让较小规模的语言模型也具备有泛化地使用各种不同的、未见过的工具的能力，进而让它们能够更好地与更广泛的工具进行交互，从而提升模型利用现实世界的资源解决问题的手段。

ToolAlpaca：通用工具使用能力学习新框架

受 Alpaca 通过微调让小模型学会通用指令遵循启发，中文信息处理实验室的研究人员探索了通过在通用工具使用数据集上微调较小规模的语言模型，让它们获得通用工具使用能力。实现上述能力的一个核心难点在于需要构建一个多样化的工具使用数据集。然而，由于工具使用涉及复杂的多方交互，现今仍然缺乏公开可用的多样化工具使用数据集。为了解决这个挑战，研究人员提出通过多智能体模拟交互的方式生成工具使用数据集。这种方法充分利用大模型强大的文本生成能力，在几乎不需要任何人工干预的情况下构建一个多样化且真实的数据集。我们从构建多样化工具集开始，之后利用多智能体模拟生成工具使用数据集，最后基于此训练出拥有通用工具使用能力的 ToolAlpaca 模型。

工具集构建：我们首先从开源仓库 public-apis 中获取工具的名称和简短描述作为初始信息，之后利用大语言模型通过 prompt 的方式将其扩展成自然语言形式的文档，描述工具提供的每一个函数及其对应的输入。为了让信息更为精细和结构化，我们进一步将这些自然语言文档扩展为遵循 OpenAPI 规范的文档，详尽描绘了每个函数的细节。结构化文档的使用不仅使我们的工具集更为细致和完备，同时也方便了我们的工具集与其他工具（如 ChatGPT 现有的 Plugin 等）进行兼容。下图为一个名为 Public Holidays 工具的示例。

工具使用实例生成：尽管我们已经构建了大规模且多样化的工具集，但构建工具使用数据集仍然是一项富有挑战性的任务。首先，由于工具集是由大模型生成的，要根据工具集文档构造如此大量的真实工具，需要大量的编程和数据收集工作，几乎不可能实现；其次，工具集本身包含了从通用到专用的各种领域的工具，使得构造与工具相关的初始指令是困难的。为此，我们提出了一种多智能体模拟交互的策略来生成工具使用数据。我们利用大模型分别模拟用户、AI 助手、工具执行器这三个智能体，通过他们之间的交互来生成丰富且实用的工具使用数据。

如上图所示，用户发起最初的指令，并通过简单的交互提供更多必要的信息。工具执行器则利用结构化文档作为提示，借助大模型来模拟工具的执行过程，从而产生相应的反馈。而AI助手则充当两者之间的桥梁，它帮助用户调用各种工具以解决问题，并最终对整个交互过程进行总结，返回给用户最终的响应结果。通过这三个智能体的交互，我们成功构建了一套能贴近真实场景需求的工具使用数据集。

ToolAlpaca 模型训练与测试：我们使用生成的数据集对 Vicuna 模型进行微调，以此得到最终的 ToolAlpaca 模型。在测试阶段，ToolAlpaca 将担任 AI 助手的角色，同时用户和工具执行器的角色仍由大模型扮演。

实验

最终，我们利用 ChatGPT 和 GPT-3.5 构造了一个包含超过400个工具、3900多条工具使用实例的模拟数据集，数据集基本统计信息如下图所示。

之后，我们在Vicuna 模型上进行微调，得到 ToolAlpaca 模型。为了评估模型的泛化性能，我们在10种未包含在训练集中的工具上构造了含有100条数据的测试集，并通过人工评价对模型的工具调用过程和整体性能进行了评估。评测结果如下图所示。

实验结果表明，无论是7B还是13B的模型，经过在 ToolAlpaca 数据集上的训练后，其性能都有了显著的提升。值得注意的是，ToolAlpaca 在测试集上的整体性能已经接近于 GPT-3.5 的表现。这些实验结果验证了我们构建数据集的有效性，同时也回答了我们最开始提出的问题：通过在多样化的工具使用数据集上微调，可以让小模型获得通用的工具使用能力。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

框架

框架

+关注

关注
0

文章
403

浏览量
17533
语言模型

语言模型

+关注

关注
0

文章
538

浏览量
10320
数据集

数据集

+关注

关注
4

文章
1209

浏览量
24803

原文标题：3000多个实例教会小模型通用工具使用能力！中文信息处理实验室提出工具学习新框架 ToolAlpaca

文章出处：【微信号：gh_e5b9d8c5c1d4，微信公众号：中科院软件所中文信息处理实验室】欢迎添加关注！文章转载请注明出处。

[原创]认证与实验室

认证、实验室特写、电磁兼容、走进实验室、Q博士案例栏目。认证实验室专题范围：认证程序、工厂审查、标准理解、测试设备管理、标准的差异化等。栏目将对一次或多次不能通过认证的企业或产品，提出

发表于 10-29 16:57

NI信号处理实验室

在NI官网下载了“信号处理实验室”，求源码而不可得，不知道哪位有源码？或者相关的源码

发表于 07-31 09:20

实验室整体解决方案是什么？

三部分。中创盟是中国首家提出实验室整体解决方案这一概念的公司。如需了解更多实验室相关信息请联系苏州中创盟实验室技术有限公司居女士 0512-

发表于 08-11 10:34

智慧实验室解决方案（LoRa）

实验室是科技的摇篮，安全、健康、环保、节能是实验室的基本要素；实验室建设经历场地-设备-系统三个阶段。在当今成系统的实验建设理念中，实验室的

发表于 02-25 14:09

KGB知识图谱引擎助力NLPIR中文信息处理

　　随着信息时代的到了，计算机在人们生产生活的各个方面将起到越来远大的作用。而对于以汉语为母语的我国来说。中文信息处理技术已经在我国信息化建设中占据了一个非常重要的地位。　　汉语在世界上属于汉藏语系

发表于 11-09 11:39

NLPIR大数据知识图谱完美展现文本数据内容

　　随着科学技术的发展，中文信息处理已经深入到了社会生活的各方面。广泛的应用对中文信息处理技术也提出了较高的要求。中文信息处理是中文(包括汉

发表于 07-01 11:40

智慧实验室教学管理系统平台开发设计案例

`实验室管理系统开发LIMS和量化管理是现代实验室管理的标志，LIMS能实现实验室的量化管理，能提高实验室的信息化水平，而量化管理能提高

发表于 12-09 16:20

系统控制与信息处理实验室精选资料分享

广西●河池学院广西高校重点实验室培训基地系统控制与信息处理重点实验室本篇博客来自河池学院: 智控无人机小组写作时间: 2020年8月15日培训总结培训训已经结束了，这一段的学习时间也告

发表于 07-19 08:09

lims实验室管理系统是什么?实验室信息管理系统介绍!

采用实验室信息管理系统或LIMS可能是提高实验室生产力的最有效方法之一。此页面的目的是帮助目前未使用LIMS的科学家和实验室人员分析采用LIMS的潜在好处。对于已经使用LIMS的组织，

发表于 11-03 11:17

实验室lims系统解决方案

，需要不同的设备集成、工作流程工具等，因此该类别中的许多产品都是专门的。为什么要使用实验室lims系统？从电子表格到记录簿，传统的数据记录方法通常不足以满足现代实验室的需求。如果没有合适的工具

发表于 11-04 11:18

实验室设计指南

实验室设计指南LBSALE[1000]LBSALE第一章基础知识主要内容：实验室基础知识及日常管理实验室基本操作技术分析数据的处理石油产品分析仪器配置要求第一节

发表于 11-09 15:43 •1662次阅读

网络虚拟实验室及实现方法

文章描述了网络虚拟实验室 的定义、框架结构、特点以及面临的关键技术,并且就当前实现网络虚拟实验室的几种主流技术进行了比较和概括.

发表于 07-04 11:11 •16次下载

易云维®实验室智能管理系统构建更适合现代医疗实验室的信息化管理体系

随着信息技术的快速发展，实验室是教育和科研的重要场所。实验室设备仪器丰富，实验项目多，管理内容多，管理难度大。部分医院在管理实验室还是人工管

发表于 06-27 11:44 •662次阅读

什么是智慧实验室综合管理平台？

管理平台目前，我国实验室存在纸质记录多、信息孤岛、不可追溯、安全隐患多、运行能耗高、管理难等问题；同时，国内LIMS实验室信息系统专业化程度低，功能结构单一，不能满足现阶段

发表于 08-22 14:20 •1435次阅读

实验室信息管理系统 LIMS 优势

在当今快节奏和数据驱动的科学研究环境中，实验室信息管理系统（LIMS）已成为提高实验室效率和准确性的关键工具。LIMS通过集成各种实验室操作

发表于 10-28 16:54 •357次阅读

搜索历史

中文信息处理实验室提出工具学习新框架ToolAlpaca

评论

[原创]认证与实验室

NI信号处理实验室

实验室整体解决方案是什么？

智慧实验室解决方案（LoRa）

KGB知识图谱引擎助力NLPIR中文信息处理

NLPIR大数据知识图谱完美展现文本数据内容

智慧实验室教学管理系统平台开发设计案例

系统控制与信息处理实验室精选资料分享

lims实验室管理系统是什么?实验室信息管理系统介绍!

实验室lims系统解决方案

实验室设计指南

网络虚拟实验室及实现方法

易云维®实验室智能管理系统构建更适合现代医疗实验室的信息化管理体系

什么是智慧实验室综合管理平台？

实验室信息管理系统 LIMS 优势