0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智谱AI领跑司南OpenCompass 2.0月度榜单,GLM-4展示强大实力

独角兽科技 来源:独角兽科技 作者:独角兽科技 2024-05-22 12:44 次阅读

近期,大模型开源开放评测体系司南(OpenCompass 2.0)公布了2024年4月大语言模型最新评测榜单,智谱AI的GLM-4继续保持国产大模型第一的领先身位。

wKgZomZNeAmAOZvZAALVoFD5HAQ911.png

大模型开源开放评测体系司南(OpenCompass 2.0)由上海人工智能实验室发布。其月度榜单从基础能力和综合能力的设计出发,构建了一套高质量的中英文双语评测基准体系,对主流开源模型和商业API模型进行了全面评测分析。评测榜单涉及的大语言模型和多模态大模型超过150个,更有包括Meta、阿里巴巴、腾讯、百度等30余家国内外企业和科研机构采用OpenCompass助力开展技术研发。

在4月客观评测榜单中,OpenCompass基于语言、知识、推理、数学、代码、智能体六个维度构建了15000余道高质量中英文双语问题,并引入OpenCompass团队首创的循环评估 (Circular Evalution) 策略,系统性分析了国内外大模型的客观性能。其中,GLM-4位列第四名,仅次于GPT-4-Turbo系列与Claude3-Opus,成为国内大模型客观评测月度总榜第一名。在语言维度方面,GLM-4分数达到57.7分表现突出,超过GPT-4-Turbo系列与Claude3-Opus。在知识维度上,GLM-4得到68.9分,超过第二名的GPT-4-Turbo-1106,与第三名Claude3-Opus不相上下。

wKgaomZNeBOAZ63KAAIJ06JMoBs074.png

值得一提的是,GLM-4此前便长期占据OpenCompass 2.0榜单前列,并多次在权威榜单与全球顶级大模型一较高下。清华《SuperBench大模型综合能力评测报告》显示,GLM-4在语义理解等方面的能力表现超过了GPT-4-Turbo等国际一流模型,在代码、智能体等方面,排名国内第一。在SuperCLUE-Fin(SC-Fin)中文原生金融大模型测评基准中,GLM-4斩获一项A+及多项A级评价,在国内大模型中排名第一。

据了解,GLM-4是由智谱AI于今年1月推出的新一代基座大模型。GLM-4整体性能逼近GPT-4,它可以支持更长的上下文,具备更强的多模态能力。同时,它的推理速度更快,支持更高的并发,大大降低推理成本。依托GLM-4 All Tools能力,GLM-4智能体能够实现自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型以完成复杂任务。

开发者可以通过智谱AI大模型开放平台bigmodel.cn接入GLM-4模型开放API,便捷高效地体验GLM-4的强大能力。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • API
    API
    +关注

    关注

    2

    文章

    1484

    浏览量

    61802
  • AI
    AI
    +关注

    关注

    87

    文章

    30084

    浏览量

    268347
  • 开源
    +关注

    关注

    3

    文章

    3244

    浏览量

    42379
  • 大模型
    +关注

    关注

    2

    文章

    2318

    浏览量

    2458
收藏 人收藏

    评论

    相关推荐

    高通与智推动多模态生成式AI体验的终端侧部署

    此前,骁龙峰会首日,智与高通技术公司宣布合作将GLM-4V端侧视觉大模型,面向骁龙8至尊版进行深度适配和推理优化,支持丰富的多模态交互方式,进一步推动多模态生成式AI在终端侧的部署和推广,赋能更加情境化、个性化的终端侧智能体验
    的头像 发表于 11-08 09:55 137次阅读

    钛动科技荣耀入选2024 CHINA AIGC 100榜单,彰显AIGC应用领先实力

    近日,备受全球AI领域关注的2024CHINAAIGC100榜单在北京盛大发布。该榜单由全球化AI领域的权威智库非凡产研精心编纂,旨在挖掘并表彰国内具有卓越潜力和创新
    的头像 发表于 10-29 15:09 380次阅读
    钛动科技荣耀入选2024 CHINA AIGC 100<b class='flag-5'>榜单</b>,彰显AIGC应用领先<b class='flag-5'>实力</b>

    AI成立科技新公司

    近日,北京智兴曜科技有限公司宣告成立,标志着智AI在科技领域的又一重要布局。该公司注册资本为3亿元人民币,展现出强大的资金实力和未来发展
    的头像 发表于 09-27 17:39 642次阅读

    AI宣布GLM-4-Flash大模型免费开放

    AI近日宣布了一项重大举措,其自主研发的GLM-4-Flash大模型正式向公众免费开放,用户可通过智AI大模型开放平台轻松调用。这款大
    的头像 发表于 08-28 17:41 816次阅读

    智能硬件接入主流大模型做语音交互(附文心一言、豆包、kimi、智glm、通义千问示例)

    接入文心一言、通义千问、豆包、智glm、kimi等国内的大模型,这个是必须可以的。但由于各家接口和数据格式不一样,有些朋友直接参考chatgpt的方式没有走通,因此本篇以聆思CSK6大模型开发板接入为
    发表于 08-21 19:13

    2024世界人工智能大会:智AI引领&quot;智小镇&quot;新纪元

    在74日至7日的2024世界人工智能大会(WAIC)上,上海世博中心及世博展览馆成为了全球AI科技与创新成果的璀璨舞台。其中,智AI以其
    的头像 发表于 07-04 16:43 659次阅读

    AI发布全新多模态开源模型GLM-4-9B

    近日,智AI在人工智能领域取得重大突破,成功推出全新开源模型GLM-4-9B。这款模型以其卓越的多模态能力,再次刷新了业界对于大型语言模型的认识。
    的头像 发表于 06-07 09:17 662次阅读

    AI推出“AI老罗”,全模型矩阵降价

    在智AI Open Day活动上,科技巨头智AI宣布了重要进展。备受瞩目的罗永浩AI智能体——“AI
    的头像 发表于 06-06 09:38 498次阅读

    AI获沙特基金4亿美元投资,估值达30亿美元

    近日,沙特阿美石油集团旗下的风险投资部门Prosperity7宣布,已参与国内知名AI企业智AI的约4亿美元融资。Prosperity7管理着一只高达30亿美元的基金,是此次智
    的头像 发表于 06-04 14:51 649次阅读

    AI亮相2024 ICLR,分享面向AGI的三大技术趋势

    GLM-4的后续升级版本即GLM-4.5及其升级模型,应当基于超级认知(Superintelligence)和超级对齐(Superalignment)技术。
    的头像 发表于 05-11 10:29 427次阅读
    智<b class='flag-5'>谱</b><b class='flag-5'>AI</b>亮相2024 ICLR,分享面向AGI的三大技术趋势

    官网上线!416日-17日,揭秘百Create大会“AI公开课”

    35日,百Create AI开发者大会官方网站正式上线。本次大会将于2024年416日至17日在深圳国际会展中心(宝安)举办,届时不仅
    的头像 发表于 03-06 15:30 879次阅读

    大模型开源开放评测体系司南正式发布

    近日,大模型开源开放评测体系司南OpenCompass2.0)正式发布,旨在为大语言模型、多模态模型等各类模型提供一站式评测服务。OpenCompass2.0的发布,将为模型技术创新提供重要的技术支撑。
    的头像 发表于 02-05 11:28 999次阅读

    AI发布新一代大模型GLM-4比肩GPT-4

    AI并未止步于技术层面的创新,他们进一步增强了智能体的能力。此次,智AI正式推出了「GLM-4-All Tools」和「GLMs」个性
    的头像 发表于 01-17 16:28 1306次阅读

    AI推出新一代基座大模型GLM-4

    AI近日宣布推出新一代基座大模型GLM-4。这一模型在整体性能上相较上一代实现了大幅提升,其表现已逼近GPT-4
    的头像 发表于 01-17 15:29 986次阅读

    阿丘科技荣获多项大奖,硬实力创领行业标杆!

    2023年阿丘科技在AI领域表现卓越,覆盖行业及部署落地场景逐步丰富且稳定增长;持续技术创新,智能相机、AI视觉软件等多款新品相继发布;领跑全国AI工业质检市场,全方位展现企业
    的头像 发表于 12-20 08:24 920次阅读
    阿丘科技荣获多项大奖,硬<b class='flag-5'>实力</b>创领行业标杆!