0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云知声山海大模型位居全球大模型第一梯队

云知声 来源:云知声 2024-09-12 14:41 次阅读

SuperCLUE发布《中文大模型基准测评2024上半年报告》,报告选取国内外有代表性的33个大模型在6月份的版本,通过多维度综合性测评,对国内外大模型发展现状进行观察与思考。

报告显示,云知声山海大模型在本次半年度评测中取得总分72的优异成绩,与360gpt2-pro、字节跳动豆包、月之暗面Kimi、百川智能Baichuan4并列国内大模型第四,稳居全球大模型第一梯队。

SuperCLUE作为国内权威通用大模型综合性测评基准,其前身可追溯至第三方中文语言理解评估基准CLUE(The Chinese Language Understanding Evaluation)。自2019年成立以来,CLUE基准一直致力于提供科学、客观、中立的语言模型评测,其先后推出了CLUE、FewCLUE、KgCLUE、DataCLUE等多个被广泛认可的评估标准。根据CLUE多年测评经验,SuperCLUE基于通用大模型在学术、产业与用户侧的广泛应用,构建了多层次、多维度的综合性测评基准。

作为一个完全独立的第三方评测机构,SuperCLUE采用自动化评测技术,有效消除人为因素带来的不确定性,确保提供无偏倚的客观评测结果。不同于传统测评通过选择题形式的测评,SuperCLUE纳入开放主观问题的测评,通过多维度多视角多层次的评测体系以及对话的形式,模拟大模型的应用场景,真实有效考察模型生成能力。与此同时,SuperCLUE根据全球的大模型技术发展趋势,不断升级迭代测评体系、测评维度和方法,以保证尽可能精准量化大模型的技术演进程度。

为进一步真实反映大模型能力,本次通用测评采用多维度、多层次的综合性测评方案,由理科、文科和Hard三大维度构成:理科任务分为计算、逻辑推理、代码测评集;文科任务分为知识百科、语言理解、长文本、角色扮演、生成与创作、安全和工具使用七大测评集;Hard任务聚焦精确指令遵循测评集,未来将陆续推出复杂多步推理和高难度问题解决等评测。

从代表通用能力的一级总分来看,山海大模型得分72,与360gpt2-pro、字节跳动豆包、月之暗面Kimi、百川智能Baichuan4并列国内大模型第四,位居全球大模型第一梯队。

具体到二级维度得分,山海大模型在理科和文科领域均表现优异——在理科能力方面,山海大模型以76分的高分紧随GPT-4o、GPT-4-Turbo-0409之后,力压一众国内大模型,并列排名国内第一;文科能力以75分的成绩并列国内第二,实力同样不容小觑。

在SuperCLUE基于基础能力和应用能力两个维度构建的模型象限图中,山海大模型被定位为“卓越领导者”。这一分类反映了山海大模型在基础和场景应用能力上均达到了领先水平,持续引领国内大模型技术发展和创新。

此外,与GPT4-Turbo-0409的对战胜率统计数据显示,山海胜率为17.67%,和率为65.37%,位列国内大模型第五,整体实力依旧不俗。

自2023年5月问世以来,山海大模型已相继在C-Eval全球大模型综合性评测、OpenCompass大模型评测、MedBench评测等多个权威评测中屡创佳绩,充分展现出业界一流的通用能力和领先于世界的行业大模型能力。

正如报告所言,随着技术进步和应用场景拓展,2024年下半年国内外大模型市场竞争将持续加剧,推动技术创新和产业升级。接下来,云知声将继续保持大模型能力稳步提升,以山海为抓手,在产业侧实现加速落地,致力成为真正助力各行各业的“新质生产力”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 云知声
    +关注

    关注

    0

    文章

    142

    浏览量

    8331
  • 字节跳动
    +关注

    关注

    0

    文章

    296

    浏览量

    8823
  • 大模型
    +关注

    关注

    2

    文章

    2126

    浏览量

    1965

原文标题:SuperCLUE 2024半年度报告:云知声山海大模型位居全球大模型第一梯队,理科能力国内并列第一,文科能力并列国内第二

文章出处:【微信号:云知声,微信公众号:云知声】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    山海模型助力司法领域智慧化升级

    近期,成功助力上海市徐汇区虹梅街道司法所打造基于山海模型的司法领域应用,极大提升了司法服务的可及性与便利性。这不仅是
    的头像 发表于 09-12 14:44 379次阅读

    推出山海多模态大模型

    在人工智能技术的浩瀚星海中,多模态交互技术正成为引领未来的新航标。继OpenAI的GPT-4o掀起滔天巨浪后,以创新之姿,推出了其匠心独运的山海多模态大
    的头像 发表于 08-27 15:20 254次阅读

    GenAI IaaS增速惊人,商汤科技跻身第一梯队

    ,与火山引擎、阿里巴巴共同跻身2023年下半年中国GenAI IaaS服务厂商TOP 3,以显著的市场份额优势位居GenAI IaaS领域的第一梯队
    的头像 发表于 07-30 11:00 519次阅读
    GenAI IaaS增速惊人,商汤科技跻身<b class='flag-5'>第一梯队</b>

    国产大模型第一梯队玩家,为什么pick了CPU?

    AI从“烧钱游戏”变为“普惠科技”,正是AIGC产业应对算力门槛,推动规模化应用落地的关键招。未来,随着技术创新和生态完善,这模式还将为更多企业创造价值,为产业发展注入新的动力。
    的头像 发表于 07-10 20:13 238次阅读
    国产大<b class='flag-5'>模型</b><b class='flag-5'>第一梯队</b>玩家,为什么pick了CPU?

    在边缘侧大模型技术探索和应用

    解决的课题。 2024高工智能汽车开发者大会暨舱驾智能与跨域论坛上,智慧座舱解决方案中心总经理鲍晴峰以《边缘侧大模型带来智能座舱交互新体验》为题,分享了
    的头像 发表于 06-29 15:30 669次阅读

    曝华为Mate 70将迎重大突破,性能重回第一梯队!

    会很明显,将重回第一梯队,而最快9月份发布。 此外,华为Mate 70系列的备货量相比Mate 60系列将有显著提升,预计增长幅度在40%至50%之间。 这意味着相较于Mate 60系列的供应紧张情况,Mate 70系列的市场供应压力将大为缓解。 在这之前,就已经有消息称,华为的新麒麟CPU已调试很好,
    的头像 发表于 05-17 09:22 230次阅读

    山海模型医疗行业版登顶上海AI实验室权威大模型评测榜

    近日,上海AI实验室和上海市数字医学创新中心联合推出的MedBench评测更新榜单,山海模型医疗行业版(UNIGPT-MED) 以综
    的头像 发表于 04-24 14:28 1680次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>医疗行业版登顶上海AI实验室权威大<b class='flag-5'>模型</b>评测榜

    山海模型再赴港IPO

    智能科技股份有限公司(简称“”)于3月15日更新了招股书,继续其在港交所主板上市的步
    的头像 发表于 03-22 14:51 560次阅读

    山海模型获得华为昇腾技术认证

    山海模型近日取得了重大突破,顺利通过了华为Atlas 800训练服务器和华为AI框架昇思MindSpore的兼容性测试。这
    的头像 发表于 02-05 09:32 815次阅读

    全新推出AIGC内容创作平台蓝藻AI

    近日,基于智能语音技术和山海模型技术,全新推出AIGC内容创作平台——蓝藻AI,为创作者提供AI声音克隆、AI文字配音、AI文案创作
    的头像 发表于 01-10 13:38 647次阅读

    山海模型助力实现换乘节点无缝高效换乘

    、出租车、网约车等多种出行方式于体的大型综合交通枢纽,是南宁对外衔接的主要门户和窗口。 此次南宁火车东站升级,是以山海
    的头像 发表于 10-31 09:27 898次阅读

    开发首个面向行业垂直领域的AI产品“龙政”政务GPT大模型

    随着大模型能力的不断完善,聚焦特定领域的大模型落地实践正迎来发展热潮。 近日,携手深圳市龙华数据有限公司,以
    的头像 发表于 10-21 09:38 2319次阅读

    “数字龙华”再添新动力,山海助力龙华构建深圳首个政务垂直领域GPT大模型

    随着大模型能力的不断完善,聚焦特定领域的大模型落地实践正迎来发展热潮。 近日,携手深圳市龙华数据有限公司,以
    发表于 10-19 17:33 271次阅读
    “数字龙华”再添新动力,<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b><b class='flag-5'>山海</b>助力龙华构建深圳首个政务垂直领域GPT大<b class='flag-5'>模型</b>

    AI语音芯片产品解锁更多交互场景

    人工智能技术热点,共话AI产业未来。 本次大会,山海模型及系列场景应用、AI语音芯片及最新应用成果亮相展会,带领观众开启
    的头像 发表于 10-13 09:30 1536次阅读

    国内外AI芯片、算力、大模型综合对比(2023)

    国内AI芯片厂商格局:一梯队,有成熟产品、批量出货的企业,包括寒武纪、华为海思、百度昆仑芯、燧原科技等;二梯队,以AI芯片起家的壁 仞科技、天数智心、摩尔线程、沐曦等;三梯队,如海光、景嘉微等。
    的头像 发表于 09-28 16:01 8282次阅读