与ChatGPT性能最相匹配的开源模型-电子发烧友网

前言

最近由UC Berkeley、CMU、Stanford, 和 UC San Diego的研究人员创建的 Vicuna-13B，通过在 ShareGPT 收集的用户共享对话数据中微调 LLaMA获得。其中使用 GPT-4 进行评估，发现Vicuna-13B 的性能达到了ChatGPT 和 Bard 的 90% 以上，同时在 90% 情况下都优于 LLaMA 和 Alpaca 等其他模型。训练 Vicuna-13B 的费用约为 300 美元。训练和代码[1]以及在线演示[2]已公开。

Vicuna到底怎么样？

Vicuna在官网中通过和Alpaca、LLaMA、ChatGPT和Bard对比，然后通过GPT4当裁判来打出分数，具体如下。

问题

Alpaca-13b vs Vicuna

LLaMA-13b vs Vicuna

ChatGPT vs Vicuna

Bard vs Vicuna

可以看出，Vicuna的回答还是非常棒的，让GPT4来打分，Vicuna和ChatGPT是十分接近的，远远高于Alpaca和LLaMA。

如果大家想试试别的问题，可以自己去尝试[3]哈。

可换不同类型的不同问题

然而，官方认为评估聊天机器人绝非易事，听过GPT4进行评估是一件十分不严格的事情，但是目前还是无法解决评估的问题，需要后续学者进行进一步探索。

图1 GPT-4 评估

在线demo

概述

图2 工作流

图 2 介绍了整体工作流程。训练是在一天时间在 8 个 A100 上使用 PyTorch FSDP 完成的。 LLaMA、Alpaca、ChatGPT 和 Vicuna 的详细比较如表 1 所示。

表1 一些模型的对比

训练

Vicuna 是通过使用从 ShareGPT.com 使用公共 API 收集的大约 7万用户共享对话微调 LLaMA 基础模型创建的。为了确保数据质量，将 HTML 转换回 markdown 并过滤掉一些不合适或低质量的样本。此外，将冗长的对话分成更小的部分，以适应模型的最大上下文长度。

训练方法建立在斯坦福alpaca的基础上，并进行了以下改进。

内存优化：为了使 Vicuna 能够理解长上下文，将最大上下文长度从alpaca 中的 512 扩展到 2048。还通过gradient checkpointing和flash attentio来解决内存压力。

多轮对话：调整训练损失考虑多轮对话，并仅根据聊天机器人的输出进行微调。

通过 Spot 实例降低成本：使用 SkyPilot 托管点来降低成本。该解决方案将 7B 模型的训练成本从 500 美元削减至 140 美元左右，将 13B 模型的训练成本从 1000 美元左右削减至 300 美元。

图3 通过GPT4来评估打分

通过GPT4评估得出的总分

审核编辑：刘清

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器人

机器人

+关注

关注
211

文章
28762

浏览量
208987
CMU

CMU

+关注

关注
0

文章
21

浏览量
15284
GPT

GPT

+关注

关注
0

文章
364

浏览量
15548
ChatGPT

ChatGPT

+关注

关注
29

文章
1576

浏览量
8158

原文标题：Vicuna：与ChatGPT 性能最相匹配的开源模型

文章出处：【微信号：zenRRan，微信公众号：深度学习自然语言处理】欢迎添加关注！文章转载请注明出处。

【「大模型启示录」阅读体验】+开启智能时代的新钥匙

阅读之旅。在翻开这本书之前，我对大模型的认知仅仅停留在它是一种强大的人工智能技术，可以进行自然语言处理、图像识别等任务。我知道像 ChatGPT 这样的应用是基于大模型开发的，能够与人类进行较为流畅

发表于 12-24 13:10

开源AI模型库是干嘛的

开源AI模型库是指那些公开源代码、允许自由访问和使用的AI模型集合。这些模型通常经过训练，能够执行特定的任务。以下，是对

发表于 12-14 10:33 •362次阅读

开源与闭源之争：最新的开源模型到底还落后多少？

一，引言随着人工智能（AI）技术的迅猛发展，大模型已经成为推动科技进步的重要力量。然而，超大规模模型在带来高性能的同时，也面临着资源消耗大、部署困难等问题。本文将探讨AI大模型未来的

发表于 11-15 11:16 •395次阅读

<b class='flag-5'>开源</b>与闭源之争：最新的<b class='flag-5'>开源</b><b class='flag-5'>模型</b>到底还落后多少？

ChatGPT：怎样打造智能客服体验的重要工具？

用户反馈和评估ChatGPT的性能。根据用户的需求和反馈，不断优化模型和改进客服体验。7.人工智能与人工混合：将ChatGPT与人工客服团队结合使用，形成人工智能与人工混合的客服模式。

发表于 11-01 11:12 •242次阅读

<b class='flag-5'>ChatGPT</b>：怎样打造智能客服体验的重要工具？

如何提升 ChatGPT 的响应速度

同时进行，从而减少总体响应时间。模型压缩：通过模型压缩技术，如量化、剪枝等，可以减少模型的大小，从而加快模型的加载和推理速度。知识蒸馏：将大型

发表于 10-25 17:39 •951次阅读

怎样搭建基于 ChatGPT 的聊天系统

搭建一个基于ChatGPT的聊天系统是一个涉及多个步骤的过程，包括理解ChatGPT的API、设计用户界面、处理数据和集成ChatGPT模型。以下是一个简化的指南，用于创建一个基本的聊

发表于 10-25 16:23 •624次阅读

如何使用 ChatGPT 进行内容创作

到ChatGPT平台。选择模型： ChatGPT目前支持GPT3.5和GPT4两个模型。根据创作需求，选择合适的模型。一般来说，GPT4

发表于 10-25 16:08 •593次阅读

澎峰科技高性能大模型推理引擎PerfXLM解析

自ChatGPT问世以来，大模型遍地开花，承载大模型应用的高性能推理框架也不断推出，大有百家争鸣之势。在这种情况下，澎峰科技作为全球领先的智能计算服务提供商，在2023年11月25日发

发表于 09-29 10:14 •717次阅读

澎峰科技高<b class='flag-5'>性能</b>大<b class='flag-5'>模型</b>推理引擎PerfXLM解析

大模型LLM与ChatGPT的技术原理

在人工智能领域，大模型（Large Language Model, LLM）和ChatGPT等自然语言处理技术（Natural Language Processing, NLP）正逐步改变着人类

发表于 07-10 10:38 •1087次阅读

llm模型和chatGPT的区别

，有许多不同的LLM模型，如BERT、GPT、T5等。 ChatGPT是一种基于GPT（Generative Pre-trained Transformer）模型的聊天机器人。GPT模型

发表于 07-09 09:55 •1398次阅读

名单公布！【书籍评测活动NO.34】大语言模型应用指南：以ChatGPT为起点，从入门到精通的AI实践教程

，包括开源和闭源两类。闭源模型的代表有OpenAI 的 GPT 系列和 Anthropic 的 Claude 系列。毫无疑问，目前 OpenAI 的 GPT 系列模型在整个行业中处于领先地位，其

发表于 06-03 11:39

OpenAI 深夜抛出王炸 “ChatGPT- 4o”， “她” 来了

当地时间5月13日OpenAI推出ChatGPT-4o，代表了人工智能向前迈出的一大步。在GPT-4turbo的强大基础上，这种迭代拥有显著的改进。在发布会的演示中，OpenAI展示该模型的高级

发表于 05-27 15:43

【Longan Pi 3H 开发板试用连载体验】给ChatGPT装上眼睛，还可以语音对话

结果整合，整合后再输入ChatGPT或其他大语言模型。最后再将大语言模型的输出结果利用TTS转化为语音进行播放。实现Chatgpt多模态输入（图像输入，语音输入），在赋予

发表于 04-12 12:41

在FPGA设计中是否可以应用ChatGPT生成想要的程序呢

当下AI人工智能崛起，很多开发领域都可看到ChatGPT的身影，FPGA设计中，是否也可以用ChatGPT辅助设计呢？

发表于 03-28 23:41

谷歌发布轻量级开源人工智能模型Gemma

谷歌近日宣布推出开源人工智能（AI）模型系列Gemma，旨在为开发人员和研究人员提供一个负责任的AI构建平台。这一举措标志着自2022年OpenAI的ChatGPT引领AI聊天机器人热潮后，谷歌首次发布重要的

发表于 02-23 11:38 •963次阅读

搜索历史

与ChatGPT性能最相匹配的开源模型

评论

【「大模型启示录」阅读体验】+开启智能时代的新钥匙

开源AI模型库是干嘛的

开源与闭源之争：最新的开源模型到底还落后多少？

ChatGPT：怎样打造智能客服体验的重要工具？

如何提升 ChatGPT 的响应速度

怎样搭建基于 ChatGPT 的聊天系统

如何使用 ChatGPT 进行内容创作

澎峰科技高性能大模型推理引擎PerfXLM解析

大模型LLM与ChatGPT的技术原理

llm模型和chatGPT的区别

名单公布！【书籍评测活动NO.34】大语言模型应用指南：以ChatGPT为起点，从入门到精通的AI实践教程

OpenAI 深夜抛出王炸 “ChatGPT- 4o”， “她” 来了

【Longan Pi 3H 开发板试用连载体验】给ChatGPT装上眼睛，还可以语音对话

在FPGA设计中是否可以应用ChatGPT生成想要的程序呢

谷歌发布轻量级开源人工智能模型Gemma