0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

与ChatGPT性能最相匹配的开源模型

深度学习自然语言处理 来源:深度学习自然语言处理 2023-04-06 10:16 次阅读

前言

最近由UC Berkeley、CMU、Stanford, 和 UC San Diego的研究人员创建的 Vicuna-13B,通过在 ShareGPT 收集的用户共享对话数据中微调 LLaMA获得。其中使用 GPT-4 进行评估,发现Vicuna-13B 的性能达到了ChatGPT 和 Bard 的 90% 以上,同时在 90% 情况下都优于 LLaMA 和 Alpaca 等其他模型。训练 Vicuna-13B 的费用约为 300 美元。训练和代码[1]以及在线演示[2]已公开。

Vicuna到底怎么样?

Vicuna在官网中通过和Alpaca、LLaMA、ChatGPT和Bard对比,然后通过GPT4当裁判来打出分数,具体如下。

13c714ec-d401-11ed-bfe3-dac502259ad0.png

问题

13de1fde-d401-11ed-bfe3-dac502259ad0.png

Alpaca-13b vs Vicuna

140b2c9a-d401-11ed-bfe3-dac502259ad0.png

LLaMA-13b vs Vicuna

1430ff2e-d401-11ed-bfe3-dac502259ad0.png

ChatGPT vs Vicuna

1454ff3c-d401-11ed-bfe3-dac502259ad0.png

Bard vs Vicuna

可以看出,Vicuna的回答还是非常棒的,让GPT4来打分,Vicuna和ChatGPT是十分接近的,远远高于Alpaca和LLaMA。

如果大家想试试别的问题,可以自己去尝试[3]哈。

1476f48e-d401-11ed-bfe3-dac502259ad0.png

可换不同类型的不同问题

然而,官方认为评估聊天机器人绝非易事,听过GPT4进行评估是一件十分不严格的事情,但是目前还是无法解决评估的问题,需要后续学者进行进一步探索。

148f1b54-d401-11ed-bfe3-dac502259ad0.png

图1 GPT-4 评估

在线demo

14a82ec8-d401-11ed-bfe3-dac502259ad0.png

概述

14cef7ec-d401-11ed-bfe3-dac502259ad0.png

图2 工作流

图 2 介绍了整体工作流程。训练是在一天时间在 8 个 A100 上使用 PyTorch FSDP 完成的。 LLaMA、Alpaca、ChatGPT 和 Vicuna 的详细比较如表 1 所示。

14f36212-d401-11ed-bfe3-dac502259ad0.png

表1 一些模型的对比

训练

Vicuna 是通过使用从 ShareGPT.com 使用公共 API 收集的大约 7万 用户共享对话微调 LLaMA 基础模型创建的。为了确保数据质量,将 HTML 转换回 markdown 并过滤掉一些不合适或低质量的样本。此外,将冗长的对话分成更小的部分,以适应模型的最大上下文长度。

训练方法建立在斯坦福alpaca的基础上,并进行了以下改进。

内存优化:为了使 Vicuna 能够理解长上下文,将最大上下文长度从alpaca 中的 512 扩展到 2048。还通过gradient checkpointingflash attentio来解决内存压力。

多轮对话调整训练损失考虑多轮对话,并仅根据聊天机器人的输出进行微调。

通过 Spot 实例降低成本:使用 SkyPilot 托管点来降低成本。该解决方案将 7B 模型的训练成本从 500 美元削减至 140 美元左右,将 13B 模型的训练成本从 1000 美元左右削减至 300 美元。

150d9588-d401-11ed-bfe3-dac502259ad0.png

图3 通过GPT4来评估打分

153299aa-d401-11ed-bfe3-dac502259ad0.png

通过GPT4评估得出的总分






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    211

    文章

    28468

    浏览量

    207358
  • CMU
    CMU
    +关注

    关注

    0

    文章

    21

    浏览量

    15259
  • GPT
    GPT
    +关注

    关注

    0

    文章

    354

    浏览量

    15419
  • ChatGPT
    +关注

    关注

    29

    文章

    1563

    浏览量

    7775

原文标题:Vicuna:与ChatGPT 性能最相匹配的开源模型

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【「大模型启示录」阅读体验】+开启智能时代的新钥匙

    阅读之旅。在翻开这本书之前,我对大模型的认知仅仅停留在它是一种强大的人工智能技术,可以进行自然语言处理、图像识别等任务。我知道像 ChatGPT 这样的应用是基于大模型开发的,能够与人类进行较为流畅
    发表于 12-24 13:10

    开源AI模型库是干嘛的

    开源AI模型库是指那些公开源代码、允许自由访问和使用的AI模型集合。这些模型通常经过训练,能够执行特定的任务。以下,是对
    的头像 发表于 12-14 10:33 197次阅读

    开源与闭源之争:最新的开源模型到底还落后多少?

    一,引言 随着人工智能(AI)技术的迅猛发展,大模型已经成为推动科技进步的重要力量。然而,超大规模模型在带来高性能的同时,也面临着资源消耗大、部署困难等问题。本文将探讨AI大模型未来的
    的头像 发表于 11-15 11:16 215次阅读
    <b class='flag-5'>开源</b>与闭源之争:最新的<b class='flag-5'>开源</b><b class='flag-5'>模型</b>到底还落后多少?

    ChatGPT:怎样打造智能客服体验的重要工具?

    用户反馈和评估ChatGPT性能。根据用户的需求和反馈,不断优化模型和改进客服体验。7.人工智能与人工混合:将ChatGPT与人工客服团队结合使用,形成人工智能与人工混合的客服模式。
    的头像 发表于 11-01 11:12 183次阅读
    <b class='flag-5'>ChatGPT</b>:怎样打造智能客服体验的重要工具?

    如何提升 ChatGPT 的响应速度

    同时进行,从而减少总体响应时间。 模型压缩 :通过模型压缩技术,如量化、剪枝等,可以减少模型的大小,从而加快模型的加载和推理速度。 知识蒸馏 :将大型
    的头像 发表于 10-25 17:39 711次阅读

    怎样搭建基于 ChatGPT 的聊天系统

    搭建一个基于ChatGPT的聊天系统是一个涉及多个步骤的过程,包括理解ChatGPT的API、设计用户界面、处理数据和集成ChatGPT模型。以下是一个简化的指南,用于创建一个基本的聊
    的头像 发表于 10-25 16:23 522次阅读

    如何使用 ChatGPT 进行内容创作

    ChatGPT平台。 选择模型ChatGPT目前支持GPT3.5和GPT4两个模型。根据创作需求,选择合适的模型。一般来说,GPT4
    的头像 发表于 10-25 16:08 467次阅读

    澎峰科技高性能模型推理引擎PerfXLM解析

    ChatGPT问世以来,大模型遍地开花,承载大模型应用的高性能推理框架也不断推出,大有百家争鸣之势。在这种情况下,澎峰科技作为全球领先的智能计算服务提供商,在2023年11月25日发
    的头像 发表于 09-29 10:14 492次阅读
    澎峰科技高<b class='flag-5'>性能</b>大<b class='flag-5'>模型</b>推理引擎PerfXLM解析

    模型LLM与ChatGPT的技术原理

    在人工智能领域,大模型(Large Language Model, LLM)和ChatGPT等自然语言处理技术(Natural Language Processing, NLP)正逐步改变着人类
    的头像 发表于 07-10 10:38 882次阅读

    llm模型chatGPT的区别

    ,有许多不同的LLM模型,如BERT、GPT、T5等。 ChatGPT是一种基于GPT(Generative Pre-trained Transformer)模型的聊天机器人。GPT模型
    的头像 发表于 07-09 09:55 1114次阅读

    名单公布!【书籍评测活动NO.34】大语言模型应用指南:以ChatGPT为起点,从入门到精通的AI实践教程

    ,包括开源和闭源两类。闭源模型的代表有OpenAI 的 GPT 系列和 Anthropic 的 Claude 系列。毫无疑问,目前 OpenAI 的 GPT 系列模型在整个行业中处于领先地位,其
    发表于 06-03 11:39

    OpenAI 深夜抛出王炸 “ChatGPT- 4o”, “她” 来了

    当地时间5月13日OpenAI推出ChatGPT-4o,代表了人工智能向前迈出的一大步。在GPT-4turbo的强大基础上,这种迭代拥有显著的改进。在发布会的演示中,OpenAI展示该模型的高级
    发表于 05-27 15:43

    在FPGA设计中是否可以应用ChatGPT生成想要的程序呢

    当下AI人工智能崛起,很多开发领域都可看到ChatGPT的身影,FPGA设计中,是否也可以用ChatGPT辅助设计呢?
    发表于 03-28 23:41

    谷歌发布轻量级开源人工智能模型Gemma

    谷歌近日宣布推出开源人工智能(AI)模型系列Gemma,旨在为开发人员和研究人员提供一个负责任的AI构建平台。这一举措标志着自2022年OpenAI的ChatGPT引领AI聊天机器人热潮后,谷歌首次发布重要的
    的头像 发表于 02-23 11:38 882次阅读

    【国产FPGA+OMAPL138开发板体验】(原创)6.FPGA连接ChatGPT 4

    方面。而且,由于ChatGPT 4是一个大型的语言模型。通常,FPGA会用于处理一些底层的数据流或执行特定的硬件加速任务,而ChatGPT 4这样的模型则会在云端或高
    发表于 02-14 21:58