0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云知声山海大模型多项评测名列前茅

云知声 来源:云知声 2024-12-24 10:29 次阅读

近日,智源研究院发布并解读了国内外100余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型综合及专项评测结果。云知声山海大模型(UniGPT4.0-0730)在此次评测中表现优异。云知声山海大模型在100多个参评大语言模型中,客观评测全球第6,国内第3;主观评测全球第12,国内第8,继续稳居我国大语言模型第一梯队。这一佳绩不仅彰显了云知声在人工智能领域的深厚技术底蕴,也标志着公司在大模型技术的应用和综合能力提升方面取得了显著的进展。云知声山海大模型的卓越表现,证明了其在激烈的市场竞争中具备强劲的竞争力,并且在技术创新和应用实践上不断取得突破。

能力卓越,山海大模型多项评测名列前茅

智源研究院的大模型评测平台FlagEval自2023年6月上线以来,已覆盖全球800余个开闭源模型,超过200万条评测题目,成为全球大模型评测的重要平台。此次评测,FlagEval在评测方法与工具上联合了全国10余家高校和机构合作共建,不仅扩展、丰富和细化了评测任务,还新增了数据处理、高级编程和工具调用的相关能力与任务,以及面向真实金融量化交易场景的应用能力评估。

在FlagEval“大语言模型评测能力榜单”中,山海大模型(UniGPT4.0-0730)在主客观两大评测维度中均展现出了非凡的实力。本轮评测主要聚焦对话模型,其中主观评测更侧重于考察中文能力。在涉及约2.2万道题目、覆盖40余个语言模型的广泛评测中,山海大模型凭借其卓越的性能,赢得了业界的广泛认可。

在客观评测方面,该榜单详尽涵盖了语言能力、知识运用、推理能力、数学能力、代码能力、指令遵循、工具调用七大评估类别,全方位考察各项技能。山海大模型(UniGPT4.0-0730)以54.46的综合评分,在榜单中位列第3,这充分彰显了其坚实的综合基础。特别是在代码能力方面,山海大模型得分高达55.05,荣获国内第1,进一步凸显了其在编程和代码处理方面的卓越才能。同时,其数学能力得分53.56,也使其荣获国内第2,再次证明了其在解决复杂数学问题上的非凡实力。

在主观评测方面,该榜单精心设置了简单理解、知识运用、推理能力、数学能力、任务解决、安全与价值观六大评估维度,全面衡量各项能力。山海大模型(UniGPT4.0-0730)凭借69.63的综合评分,在榜单中脱颖而出,位列第8名,充分展示了其强大的综合性能。此外,其数学能力得分高达71,位居国内第3名,进一步凸显了山海大模型在解决复杂数学问题上的出色能力。

智慧赋能,加速AI应用落地与产业升级

随着人工智能技术的快速发展,大模型已成为全球科技竞争的新高地、未来产业的新赛道、经济发展的新引擎。当前,通用大模型、行业大模型以及端侧大模型正如雨后春笋般层出不穷,大模型产业的应用落地步伐显著加快。

作为国内顶尖的人工智能独角兽企业,云知声于2016年开始建立Atlas人工智能基础设施,并以此为基础,构建云知大脑(UniBrain)技术中台——以山海(UniGPT)通用认知大模型为核心,结合多模态感知与生成、知识图谱、物联平台等智能组件,为云知声智慧物联、智慧医疗、智慧座舱、智慧交通等业务提供高效的产品化支撑,持续推动千行百业的智慧化升级。

山海大模型作为云知大脑的核心,在实际应用中展现出了卓越的潜力与实力。通过持续的技术创新和丰富的应用场景实践,山海大模型不仅在通用能力上达到了世界一流水平,而且在专业能力上也表现出色,处于行业领先地位。

目前,山海大模型已相继在OpenCompass大模型评测、SuperCLUE中文大模型基准测评、MedBench评测、Flageval大模型评测、SuperBench、MMMU等多个权威评测中屡创佳绩,稳居国内大模型第一梯队,展现了其强大的通用能力。在专业能力层面,其基于山海大模型孵化的医疗大模型在CCKS 2023 PromptCBLUE医疗大模型评测中夺得通用赛道一等奖,并在2024年5月和6月的MedBench评测中连续登顶榜首。此外,在2024年全国智慧医保大赛中,凭借“基于大模型的DRG结算清单智能生成方案”,团队在总决赛中荣获一等奖。

此次荣登智源FlagEval“百模”评测榜前列,不仅是对山海大模型技术实力的有力证明,更是对其在人工智能领域持续创新和深耕细作的肯定。未来,云知声将继续秉承创新理念,不断突破技术瓶颈,为人工智能产业的发展贡献更多力量,推动AI技术创新与行业应用的深度融合。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    47229

    浏览量

    238343
  • 云知声
    +关注

    关注

    0

    文章

    185

    浏览量

    8390
  • 大模型
    +关注

    关注

    2

    文章

    2436

    浏览量

    2666

原文标题:智源FlagEval“百模”评测揭晓:云知声山海大模型表现卓越,名列前茅

文章出处:【微信号:云知声,微信公众号:云知声】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    近期斩获多项年度大奖

    在科技迅猛发展的当下,人工智能(AI)已成为推动各行业革新的核心动力。,以其卓越的技术实力和敏锐的市场洞察,在AI领域中脱颖而出,成为行业的领航者。近日,
    的头像 发表于 12-24 10:26 84次阅读

    与英内物联签署战略合作协议 探索基于山海模型的多元智慧场景

    ‍‍ 12月6日,(上海)智能科技有限公司(以下简称““)与上海英内物联网科技股份有
    的头像 发表于 12-06 20:05 849次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>与英内物联签署战略合作协议 探索基于<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>的多元智慧场景

    荣登2024大模型企业TOP50榜单

    近日,智领未来·向新而行—2024人工智能大模型产业大会在京召开,会上揭晓2024大模型企业TOP50榜单,荣登榜单,
    的头像 发表于 11-29 17:52 484次阅读

    山海模型多项能力全球领跑

    国内人工智能权威机构清华大学基础模型研究中心发布SuperBench九月综合榜单。本次评测选取海内外24个具有代表性的大模型,结果显示,山海模型
    的头像 发表于 10-12 14:30 407次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b><b class='flag-5'>多项</b>能力全球领跑

    山海多模态大模型UniGPT-mMed登顶MMMU测评榜首

    近日,多模态人工智能模型基准评测集MMMU更新榜单,山海多模态大
    的头像 发表于 10-12 14:09 291次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b><b class='flag-5'>山海</b>多模态大<b class='flag-5'>模型</b>UniGPT-mMed登顶MMMU测评榜首

    山海模型医疗专业能力全球第一

    近日,由上海AI实验室和上海市数字医学创新中心联合推出的MedBench评测更新榜单,继4月份夺冠后,山海
    的头像 发表于 09-19 15:47 339次阅读

    口语评测技术应用于教育领域

    日前,入选大连、丹东、本溪三地初中学业水平考试英语听力口语考试智能口语评测技术服务商,并以其专业可靠的口语评测,确保三地英语考试结果的
    的头像 发表于 09-19 15:41 312次阅读

    山海模型助力司法领域智慧化升级

    近期,成功助力上海市徐汇区虹梅街道司法所打造基于山海模型的司法领域应用,极大提升了司法服务的可及性与便利性。这不仅是
    的头像 发表于 09-12 14:44 598次阅读

    推出山海多模态大模型

    在人工智能技术的浩瀚星海中,多模态交互技术正成为引领未来的新航标。继OpenAI的GPT-4o掀起滔天巨浪后,以创新之姿,推出了其匠心独运的山海多模态大
    的头像 发表于 08-27 15:20 390次阅读

    说话人识别引擎获得HUAWEI COMPATIBLE证书及认证徽标的使用权

    山海模型获得两项华为昇腾技术认证后,近日,经华为综合评测说话人识别引擎成功通过与华为
    的头像 发表于 05-27 18:12 767次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>说话人识别引擎获得HUAWEI COMPATIBLE证书及认证徽标的使用权

    山海模型医疗行业版登顶上海AI实验室权威大模型评测

    近日,上海AI实验室和上海市数字医学创新中心联合推出的MedBench评测更新榜单,山海模型
    的头像 发表于 04-24 14:28 1842次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>医疗行业版登顶上海AI实验室权威大<b class='flag-5'>模型</b><b class='flag-5'>评测</b>榜

    山海模型再赴港IPO

    智能科技股份有限公司(简称“”)于3月15日更新了招股书,继续其在港交所主板上市的步
    的头像 发表于 03-22 14:51 714次阅读

    再闯港股IPO

    近日,备受瞩目的智能科技股份有限公司(以下简称)再次更新了其招股书,继续稳步推进其在
    的头像 发表于 03-22 14:42 700次阅读

    山海模型获得华为昇腾技术认证

    山海模型近日取得了重大突破,顺利通过了华为Atlas 800训练服务器和华为AI框架昇思MindSpore的兼容性测试。这一成就标志
    的头像 发表于 02-05 09:32 997次阅读

    全新推出AIGC内容创作平台蓝藻AI

    近日,基于智能语音技术和山海模型技术,全新推出AIGC内容创作平台——蓝藻AI,为创作者提供AI声音克隆、AI文字配音、AI文案创作
    的头像 发表于 01-10 13:38 830次阅读