0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Claude-3力压GPT-4荣膺最佳大语言模型

微云疏影 来源:综合整理 作者:综合整理 2024-03-28 15:23 次阅读

近日,LMSYS Org发布最新的基准测试报告,显示Cordulas公司的Claude-3在平台大语言模型中的得分略胜OpenAI的GPT-4。

值得注意的是,LMSYS Org是由加州大学伯克利分校、加州大学圣地亚哥分校以及卡内基梅隆大学共同发起设立的研究组织。

日前,这家机构推出了一项名为Chatbot Arena的服务,这是针对大语言模型(LLM)进行评估的基准平台,该平台采用众包形式对大型语言模型进行匿名随机竞争打分,参考源于竞技比赛领域中广泛应用的Elo评分体系。

分数评价结果主要取决于用户的投票意向,每次由系统随机挑选两个不同的大语言模型参与与用户的对话,同时,为保障客观性,匿名选择哪个版本的大模型表现优秀至关重要。

自去年启动以来,GPT-4一直占据评测榜单之首。然而,昨日,由Anthropos推出的Claude 3 Opus以微弱优势战胜了GPT-4,将OpenAI的LLM挤出了首位。

考虑到细微差距及误差风险,委员会决定授予Claude 3与GPT-4并列第一的荣誉,GPT-4的另外一个预设版也被列入并列第一的行列。此外,更引人注目的是,Claude 3 Haiku成功跻身前十名。Haiku是Anthropos针对本地规模的新型模型,功能类似谷歌的GeminiNano。

相较Opus参数高达几万亿,Haiku体型更为紧凑,运行速度更快。据LMSYS数据显示,Haikn在评测成绩中排名第七,与GPT-4表现不遑多让。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6142

    浏览量

    105116
  • 语言模型
    +关注

    关注

    0

    文章

    508

    浏览量

    10247
  • GPT
    GPT
    +关注

    关注

    0

    文章

    352

    浏览量

    15318
收藏 人收藏

    评论

    相关推荐

    Llama 3GPT-4 比较

    沿。 一、技术架构 Llama 3GPT-4都是基于深度学习的自然语言处理(NLP)模型,但它们的设计理念和技术细节有所不同。 Llama 3
    的头像 发表于 10-27 14:17 277次阅读

    OpenAI推出新模型CriticGPT,用GPT-4自我纠错

    基于GPT-4模型——CriticGPT,这款模型专为捕获ChatGPT代码输出中的错误而设计,其独特的作用在于,让人们能够用GPT-4来查找GP
    的头像 发表于 06-29 09:55 520次阅读

    Anthropic 发布Claude 3.5 Sonnet模型运行速度是Claude 3 Opus的两倍

    Anthropic 发布Claude 3.5 Sonnet最新模型模型在推理、知识和编码能力评估方面超越了以前的版本和竞争对手GPT 4
    的头像 发表于 06-21 15:43 728次阅读
    Anthropic 发布<b class='flag-5'>Claude</b> 3.5 Sonnet<b class='flag-5'>模型</b>运行速度是<b class='flag-5'>Claude</b> <b class='flag-5'>3</b> Opus的两倍

    Anthropic Claude 3模型重磅来袭!微美全息(WIMI.US)全力冲刺加入GPT革命!

    在AI逻辑基准测试中超过了ChatGPT-4Claude 3 Opus 超越 GPT-4   Anthropic声称,Claude
    的头像 发表于 03-27 10:59 334次阅读
    Anthropic <b class='flag-5'>Claude</b> <b class='flag-5'>3</b>大<b class='flag-5'>模型</b>重磅来袭!微美全息(WIMI.US)全力冲刺加入<b class='flag-5'>GPT</b>革命!

    微软Copilot全面更新为OpenAI的GPT-4 Turbo模型

    起初,Copilot作为Bing Chat AI助手推出,初期采用GPT-3.5模型,随后升级至GPT-4取得显著进步,如今再次更新至性能卓越的GPT-4 Turbo
    的头像 发表于 03-13 13:42 686次阅读

    Anthropic 发布 Claude 3 系列大模型和 AI 助手

    的表现超越了 GPT-4/3.5 和 Gemini 1.0 Ultra/Pro。   目前Opus 和 Sonnet 已可通过 claude网站和 Claude API 使用,而 Haiku 将在未来几周内推出。
    的头像 发表于 03-08 12:29 406次阅读

    新火种AI|秒杀GPT-4,狙杀GPT-5,横空出世的Claude 3振奋人心!

    GPT-4被拉下神坛, Claude 3很可能对GPT-4实现全方位的碾压 。 Anthropic发布3
    的头像 发表于 03-06 22:22 605次阅读
    新火种AI|秒杀<b class='flag-5'>GPT-4</b>,狙杀<b class='flag-5'>GPT</b>-5,横空出世的<b class='flag-5'>Claude</b> <b class='flag-5'>3</b>振奋人心!

    Anthropic发布Claude 3系列大语言模型,挑战OpenAI领先地位

    人工智能领域的创业公司Anthropic推出了其备受瞩目的Claude 3系列大型语言模型。该系列包括Claude
    的头像 发表于 03-06 18:11 1226次阅读

    全球最强大模型易主,Claude 3全面超越GPT-4

    由谷歌和亚马逊支持的AI初创公司Anthropic近日发布了其全新的Claude 3模型家族,该家族包含三个重要成员:Claude 3 Op
    的头像 发表于 03-06 10:44 707次阅读

    Anthropic推出Claude 3大型语言模型,在认知任务性能上创新高

    据官方披露,Claude 3 旗舰 Opus 在大学生和研究生范畴的学术知识、复杂数理任务了解部分超越 OpenAI 的 GPT-4 以及谷歌的 Gemini 1.0 Ultra。
    的头像 发表于 03-05 11:16 465次阅读

    全球最强大模型易主,GPT-4被超越

    近日,AI领域的领军企业Anthropic宣布推出全新的Claude 3系列模型,其中包括最强版Claude 3 Opus。据该公司称,
    的头像 发表于 03-05 09:58 624次阅读

    Anthropic推出Claude 3系列模型,全面超越GPT-4,树立AI新标杆

    近日,AI领域的领军企业Anthropic震撼发布了全新的Claude 3系列模型,该系列模型在多模态和语言能力等关键领域展现出卓越性能,成
    的头像 发表于 03-05 09:49 646次阅读

    Anthropic发布Claude 3系列,超越GPT-4和Gemini Ultra

    人工智能领域的领军企业Anthropic宣布推出全新的Claude 3系列模型,包括Claude 3 Opus、
    的头像 发表于 03-05 09:43 609次阅读

    全球最强大模型易主:GPT-4被超越,Claude 3系列崭露头角

    近日,人工智能领域迎来了一场革命性的突破。Anthropic公司发布了全新的Claude 3系列模型,该系列模型在多模态和语言能力等关键指标
    的头像 发表于 03-05 09:42 615次阅读

    ChatGPT plus有什么功能?OpenAI 发布 GPT-4 Turbo 目前我们所知道的功能

    截止、扩展的上下文窗口、预算友好的定价等。 什么是GPT-4 Turbo? GPT-4 Turbo是现有GPT-4语言模型的更新。它带来了
    的头像 发表于 12-13 09:19 1073次阅读
    ChatGPT plus有什么功能?OpenAI 发布 <b class='flag-5'>GPT-4</b> Turbo 目前我们所知道的功能