0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何最好地使用所有可用的 LLM 工具

Qxwdz168 来源:计算机视觉芯片设计 2023-05-23 17:22 次阅读

许多企业(OpenAI、AI21、CoHere 等)正在提供 LLM 作为服务,因为它们在商业、科学和金融环境中具有诱人的潜力。虽然 GPT-4 和其他 LLM 在诸如问答等任务上展示了破纪录的性能,但它们在高吞吐量应用程序中的使用可能会非常昂贵。例如,使用 GPT-4 协助客户服务可能会使小型企业每月花费超过 21,000 美元,而 ChatGPT 预计每天花费超过 700,000 美元。使用最大的 LLM 需要付出高昂的货币代价,并对环境和社会产生严重的负面影响。

研究表明,许多 LLM 可以通过 API 以各种定价获得。使用 LLM API 的成本通常分为三个部分:

提示成本(与提示的持续时间成比例)
生成成本(与生成长度成比例)
每个问题的固定费用。
鉴于价格和质量的广泛差异,从业者可能很难决定如何最好地使用所有可用的 LLM 工具。此外,如果服务中断,则依赖单个 API 提供者是不可靠的,这可能发生在意外高需求的情况下。

上传失败,网络异常。

重试

当前模型级联和 FrugalML 等模型集成范例未考虑 LLM 的局限性,这些范例是为具有固定标签集的预测任务开发的。

斯坦福大学最近的研究提出了一个名为 FrugalGPT 的预算友好型框架的概念,它利用 LLM API 来处理自然语言查询。

及时适应、LLM 近似和 LLM 级联是降低成本的三种主要方法。为了节省开支,提示适应调查了确定哪些提示最有效的方法。通过近似复杂且昂贵的 LLM,可以开发更简单且更具成本效益的替代方案,其性能与原始方案一样好。 LLM 级联的关键思想是为各种查询动态选择合适的 LLM API。

实施并评估了基于 LLM 级联构建的 FrugalGPT 基本版本,以展示这些想法的潜力。对于每个数据集和任务,FrugalGPT 学习如何自适应地将数据集中的问题分类到 LLM 的各种组合,例如 ChatGPT、GPT-3 和 GPT-4。与最好的单个 LLM API 相比,FrugalGPT 节省了高达 98% 的推理成本,同时在下游任务上保持相同的性能。另一方面,FrugalGPT 可以以相同的价格实现高达 4% 的性能提升。

FrugalGPT 的 LLM 级联技术需要对标记示例进行训练。此外,为了使级联有效,训练和测试示例应该具有相同或相似的分布。此外,掌握LLM级联也需要时间和精力。

FrugalGPT 寻求性能和成本之间的平衡,但其他因素,包括延迟、公平性、隐私和环境影响,在实践中更为重要。该团队认为,未来的研究应侧重于在不牺牲性能或成本效益的情况下将这些功能纳入优化方法。 LLM 生成的结果的不确定性也需要仔细量化以用于风险关键型应用。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • API
    API
    +关注

    关注

    2

    文章

    1502

    浏览量

    62079
  • 数据集
    +关注

    关注

    4

    文章

    1208

    浏览量

    24713
  • 自然语言
    +关注

    关注

    1

    文章

    288

    浏览量

    13351
  • LLM
    LLM
    +关注

    关注

    0

    文章

    288

    浏览量

    351

原文标题:斯坦福研究人员介绍 FrugalGPT:一种新的 AI 框架,用于 LLM API 处理自然语言查询

文章出处:【微信号:计算机视觉芯片设计,微信公众号:计算机视觉芯片设计】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    对比解码在LLM上的应用

    为了改进LLM的推理能力,University of California联合Meta AI实验室提出将Contrastive Decoding应用于多种任务的LLM方法。实验表明,所提方法能有效改进LLM的推理能力。让我们走进
    发表于 09-21 11:37 632次阅读
    对比解码在<b class='flag-5'>LLM</b>上的应用

    有什么好用的verilog HDL编辑工具可用

    有什么好用的verilog HDL编辑工具可用最好能集成实时的verilog HDL语法检测、自定义模块识别触发等功能,最好能够免费;
    发表于 04-28 11:00

    部落冲突辅助工具终极推荐:免root离线挂机【本人用过所有辅助中最好的】

    部落冲突辅助工具终极推荐:免root离线挂机【本人用过所有辅助中最好的】相信很多小伙伴都玩部落冲突好久了,偶也是,为了节省时间、精力升本,有时候会借助下工具,哈哈!部落冲突辅助
    发表于 02-24 11:56

    最好的杀木马清除工具

    推荐最强最好的杀木马清除工具AVGAnti-Spyware--极致安全完美防护.针对因特网上传播的新一代安全威胁的有效解决方案.确保您的数据安全,保护您的隐私,抵御间谍软件,广告软件,木马
    发表于 01-17 13:19 47次下载

    最好的最强的杀木马工具

    最好的最强的杀木马工具,AVG Anti-Spyware -- 极致安全 完美防护.针对因特网上传播的新一代安全威胁的有效解决方案.确保您的数据安全,保护您的隐私,抵御间谍软件,广告软件,
    发表于 07-17 10:39 15次下载

    Microsoft已经确认它将很快可用所有兼容设备

    到目前为止,该新功能只能由Windows Insider程序的代表进行测试。谁已收到Build 20185的更新。Microsoft已经确认它将很快可用所有兼容设备。
    的头像 发表于 09-25 16:39 2174次阅读

    如何用旁路工具提升网络可用性?

    在将内联安全工具构建到您的网络中时,结合网络旁路技术是避免代价高昂的网络停机时间的基本最佳实践。简而言之,旁路 TAP,也称为“旁路交换机”,能够随时管理内联工具可用性,而无需中断网络或影响业务
    的头像 发表于 06-25 14:41 1327次阅读

    中国研究人员提出StructGPT,提高LLM对结构化数据的零样本推理能力

    尽管结构化数据的体量往往非常巨大,但不可能容纳输入提示中的所有数据记录(例如,ChatGPT 的最大上下文长度为 4096)。将结构化数据线性化为 LLM 可以轻松掌握的语句是解决此问题的简单方法。工具操作技术激励他们增强
    的头像 发表于 05-24 16:02 3006次阅读
    中国研究人员提出StructGPT,提高<b class='flag-5'>LLM</b>对结构化数据的零样本推理能力

    NVIDIA AI Foundation Models:使用生产就绪型 LLM 构建自定义企业聊天机器人和智能副驾

      系列基础模型是一套功能强大的全新工具可用于为企业构建生产就绪生成式 AI 应用,从而推动从客服 AI 聊天机器人到尖端 AI 产品的各种创新。 这些新的基础模型现已加入  NVIDIA NeMo 。这个端到端框架用于构建、自定义和部署专为企业定制的
    的头像 发表于 11-17 21:35 906次阅读
    NVIDIA AI Foundation Models:使用生产就绪型 <b class='flag-5'>LLM</b> 构建自定义企业聊天机器人和智能副驾

    什么是LLMLLM的工作原理和结构

    随着人工智能技术的飞速发展,大型语言模型(Large Language Model,简称LLM)逐渐成为自然语言处理(NLP)领域的研究热点。LLM以其强大的文本生成、理解和推理能力,在文本
    的头像 发表于 07-02 11:45 7827次阅读

    LLM模型的应用领域

    在本文中,我们将深入探讨LLM(Large Language Model,大型语言模型)的应用领域。LLM是一种基于深度学习的人工智能技术,它能够理解和生成自然语言文本。近年来,随着计算能力的提高
    的头像 发表于 07-09 09:52 607次阅读

    llm模型有哪些格式

    LLM(Large Language Model,大型语言模型)是一种深度学习模型,主要用于处理自然语言处理(NLP)任务。LLM模型的格式多种多样,以下是一些常见的LLM模型格式
    的头像 发表于 07-09 09:59 635次阅读

    LLM大模型推理加速的关键技术

    LLM(大型语言模型)大模型推理加速是当前人工智能领域的一个研究热点,旨在提高模型在处理复杂任务时的效率和响应速度。以下是对LLM大模型推理加速关键技术的详细探讨,内容将涵盖模型压缩、解码方法优化、底层优化、分布式并行推理以及特定框架和
    的头像 发表于 07-24 11:38 900次阅读

    LLM技术对人工智能发展的影响

    随着人工智能技术的飞速发展,大型语言模型(LLM)技术已经成为推动AI领域进步的关键力量。LLM技术通过深度学习和自然语言处理技术,使得机器能够理解和生成自然语言,极大地扩展了人工智能的应用范围
    的头像 发表于 11-08 09:28 398次阅读

    什么是LLMLLM在自然语言处理中的应用

    随着人工智能技术的飞速发展,自然语言处理(NLP)领域迎来了革命性的进步。其中,大型语言模型(LLM)的出现,标志着我们对语言理解能力的一次飞跃。LLM通过深度学习和海量数据训练,使得机器能够以前
    的头像 发表于 11-19 15:32 617次阅读