Claude-3力压GPT-4荣膺最佳大语言模型-电子发烧友网

Claude-3力压GPT-4荣膺最佳大语言模型

近日，LMSYS Org发布最新的基准测试报告，显示Cordulas公司的Claude-3在平台大语言模型中的得分略胜OpenAI的GPT-4。

值得注意的是，LMSYS Org是由加州大学伯克利分校、加州大学圣地亚哥分校以及卡内基梅隆大学共同发起设立的研究组织。

日前，这家机构推出了一项名为Chatbot Arena的服务，这是针对大语言模型（LLM）进行评估的基准平台，该平台采用众包形式对大型语言模型进行匿名随机竞争打分，参考源于竞技比赛领域中广泛应用的Elo评分体系。

分数评价结果主要取决于用户的投票意向，每次由系统随机挑选两个不同的大语言模型参与与用户的对话，同时，为保障客观性，匿名选择哪个版本的大模型表现优秀至关重要。

自去年启动以来，GPT-4一直占据评测榜单之首。然而，昨日，由Anthropos推出的Claude 3 Opus以微弱优势战胜了GPT-4，将OpenAI的LLM挤出了首位。

考虑到细微差距及误差风险，委员会决定授予Claude 3与GPT-4并列第一的荣誉，GPT-4的另外一个预设版也被列入并列第一的行列。此外，更引人注目的是，Claude 3 Haiku成功跻身前十名。Haiku是Anthropos针对本地规模的新型模型，功能类似谷歌的GeminiNano。

相较Opus参数高达几万亿，Haiku体型更为紧凑，运行速度更快。据LMSYS数据显示，Haikn在评测成绩中排名第七，与GPT-4表现不遑多让。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

谷歌

谷歌

+关注

关注
27

文章
6172

浏览量
105622
语言模型

语言模型

+关注

关注
0

文章
529

浏览量
10292
GPT

GPT

+关注

关注
0

文章
354

浏览量
15431

Llama 3 与 GPT-4 比较

沿。一、技术架构 Llama 3和GPT-4都是基于深度学习的自然语言处理（NLP）模型，但它们的设计理念和技术细节有所不同。 Llama 3

发表于 10-27 14:17 •385次阅读

OpenAI推出新模型CriticGPT，用GPT-4自我纠错

基于GPT-4的模型——CriticGPT，这款模型专为捕获ChatGPT代码输出中的错误而设计，其独特的作用在于，让人们能够用GPT-4来查找GP

发表于 06-29 09:55 •559次阅读

Anthropic 发布Claude 3.5 Sonnet模型运行速度是Claude 3 Opus的两倍

Anthropic 发布Claude 3.5 Sonnet最新模型新模型在推理、知识和编码能力评估方面超越了以前的版本和竞争对手GPT 4

发表于 06-21 15:43 •840次阅读

Anthropic Claude 3大模型重磅来袭！微美全息（WIMI.US）全力冲刺加入GPT革命！

在AI逻辑基准测试中超过了ChatGPT-4。 Claude 3 Opus 超越 GPT-4 Anthropic声称，Claude

发表于 03-27 10:59 •367次阅读

微软Copilot全面更新为OpenAI的GPT-4 Turbo模型

起初，Copilot作为Bing Chat AI助手推出，初期采用GPT-3.5模型，随后升级至GPT-4取得显著进步，如今再次更新至性能卓越的GPT-4 Turbo

发表于 03-13 13:42 •748次阅读

Anthropic 发布 Claude 3 系列大模型和 AI 助手

的表现超越了 GPT-4/3.5 和 Gemini 1.0 Ultra/Pro。目前Opus 和 Sonnet 已可通过 claude网站和 Claude API 使用,而 Haiku 将在未来几周内推出。

发表于 03-08 12:29 •444次阅读

新火种AI|秒杀GPT-4，狙杀GPT-5，横空出世的Claude 3振奋人心！

的GPT-4被拉下神坛， Claude 3很可能对GPT-4实现全方位的碾压。 Anthropic发布3个

发表于 03-06 22:22 •683次阅读

Anthropic发布Claude 3系列大语言模型，挑战OpenAI领先地位

人工智能领域的创业公司Anthropic推出了其备受瞩目的Claude 3系列大型语言模型。该系列包括Claude

发表于 03-06 18:11 •1296次阅读

全球最强大模型易主，Claude 3全面超越GPT-4

由谷歌和亚马逊支持的AI初创公司Anthropic近日发布了其全新的Claude 3模型家族，该家族包含三个重要成员：Claude 3 Op

发表于 03-06 10:44 •777次阅读

OpenAI推出ChatGPT新功能：朗读，支持37种语言，兼容GPT-4和GPT-3

据悉，“朗读”功能支持37种语言，且能够自主识别文本类型并对应相应的发音。值得关注的是，该功能对GPT-4以及GPT-3.5版本的ChatGPT均适用。此举彰显了OpenAI致力于“多模态交互”（multimodal capab

发表于 03-05 15:48 •958次阅读

Anthropic推出Claude 3大型语言模型，在认知任务性能上创新高

据官方披露，Claude 3 旗舰 Opus 在大学生和研究生范畴的学术知识、复杂数理任务了解部分超越 OpenAI 的 GPT-4 以及谷歌的 Gemini 1.0 Ultra。

发表于 03-05 11:16 •530次阅读

全球最强大模型易主，GPT-4被超越

近日，AI领域的领军企业Anthropic宣布推出全新的Claude 3系列模型，其中包括最强版Claude 3 Opus。据该公司称，

发表于 03-05 09:58 •676次阅读

Anthropic推出Claude 3系列模型，全面超越GPT-4，树立AI新标杆

近日，AI领域的领军企业Anthropic震撼发布了全新的Claude 3系列模型，该系列模型在多模态和语言能力等关键领域展现出卓越性能，成

发表于 03-05 09:49 •701次阅读

Anthropic发布Claude 3系列，超越GPT-4和Gemini Ultra

人工智能领域的领军企业Anthropic宣布推出全新的Claude 3系列模型，包括Claude 3 Opus、

发表于 03-05 09:43 •682次阅读

全球最强大模型易主：GPT-4被超越，Claude 3系列崭露头角

近日，人工智能领域迎来了一场革命性的突破。Anthropic公司发布了全新的Claude 3系列模型，该系列模型在多模态和语言能力等关键指标

发表于 03-05 09:42 •671次阅读

搜索历史

Claude-3力压GPT-4荣膺最佳大语言模型

评论

Llama 3 与 GPT-4 比较

OpenAI推出新模型CriticGPT，用GPT-4自我纠错

Anthropic 发布Claude 3.5 Sonnet模型运行速度是Claude 3 Opus的两倍

Anthropic Claude 3大模型重磅来袭！微美全息（WIMI.US）全力冲刺加入GPT革命！

微软Copilot全面更新为OpenAI的GPT-4 Turbo模型

Anthropic 发布 Claude 3 系列大模型和 AI 助手

新火种AI|秒杀GPT-4，狙杀GPT-5，横空出世的Claude 3振奋人心！

Anthropic发布Claude 3系列大语言模型，挑战OpenAI领先地位

全球最强大模型易主，Claude 3全面超越GPT-4

OpenAI推出ChatGPT新功能：朗读，支持37种语言，兼容GPT-4和GPT-3

Anthropic推出Claude 3大型语言模型，在认知任务性能上创新高

全球最强大模型易主，GPT-4被超越

Anthropic推出Claude 3系列模型，全面超越GPT-4，树立AI新标杆

Anthropic发布Claude 3系列，超越GPT-4和Gemini Ultra

全球最强大模型易主：GPT-4被超越，Claude 3系列崭露头角