0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云知声山海多模态大模型UniGPT-mMed登顶MMMU测评榜首

云知声 来源:云知声 2024-10-12 14:09 次阅读

近日,多模态人工智能模型基准评测集MMMU更新榜单,云知声山海多模态大模型UniGPT-mMed以通用能力、医疗专业能力双双排名第一的优异成绩登顶榜首,力压GPT-4V,充分彰显其硬核实力。

作为国内权威多模态基准评测,MMMU由IN.AI Research等多家机构联合构建,专注于考量人工智能在解决大学层次多学科问题时的多模态理解与推理能力。

该评测集涉及艺术与设计、商科、科学、健康与医学、人文与社会科学、技术与工程等六个常见学科,包含 1.15 万个精心选取的多模态问题,涵盖 30 个不同的科目和183 个子领域。同时,MMMU 中许多问题都需要专家级的推理能力,例如,使用傅立叶变换或均衡理论来推导问题的解,这在满足评测内容广泛性的同时,也确保了其深度。

此外,MMMU还提出了两个独特的挑战:一是其涵盖多种图像格式,从照片和绘画等视觉场景到图表和表格,可用于测试 LMM 的感知能力;二是MMMU的输入形式是文本和图像的混合,要求AI模型能够将图像和文本信息结合起来进行深入理解,并在此基础上执行复杂推理。这不仅考验了模型的学科知识储备,也对其综合分析和应用能力提出了更高要求。

评测结果显示,云知声山海多模态大模型UniGPT-mMed以总分57的优异成绩登顶榜首,并在健康与医学细分赛道超越GPT-4V,力压一众大模型拔得头筹,充分展现出其在拥有业内一流的通用能力之外,更具备打造世界领先的行业大模型的能力。

bca3a6b2-877d-11ef-b8af-92fbcf53809c.png

UniGPT-mMed是云知声基于山海大模型底座构建的多模态大模型。其通过分析和整合海量论文、书籍及网站数据,利用精细化数据处理技术,自动识别并提取图片及其相关文本描述,并通过多模态分析技术评估图片的质量和图文之间的匹配度,筛选出最优数据。与此同时,系统能够参考图片和上下文信息对图片进行重新描述,使得图文数据更加对齐。

通过预设问答场景,UniGPT-mMed能够将图文对齐数据转化为高质量的场景问答数据集,并采用思维链和自我反思技术,进一步优化生成数据,最终构建起一个包含数亿条高质量图文问答的数据集,进而为用户提供更加丰富、准确和可靠的信息检索和问答服务。

此次评测,是云知声在多模态大模型赛道持续深耕、不断技术创新的成果体现。

作为中国AGI技术产业化的先行者,云知声于2016年开始打造Atlas人工智能基础设施,并以此为基础,构建云知大脑(UniBrain)技术中台——以山海(UniGPT)通用认知大模型为核心,结合多模态感知与生成、知识图谱、物联平台等智能组件,为云知声智慧物联、智慧医疗、智慧座舱、智慧交通等业务提供高效的产品化支撑,持续推动“U(云知大脑)+X(应用场景)”战略布局,致力推动千行百业的智慧化升级。

作为云知大脑的核心,山海大模型具备语言生成、语言理解、知识问答、逻辑推理、代码能力、数学能力、安全合规能力七项通用能力及插件扩展、领域增强、企业定制三项行业落地能力,能够满足更多场景的应用需求。今年8月,云知声推出山海多模态大模型,通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出,带来实时多模态拟人交互体验,开启AGI新范式。

目前,山海大模型已相继在OpenCompass大模型评测、SuperCLUE中文大模型基准测评、MedBench评测、Flageval大模型评测、SuperBench等多个权威评测中屡创佳绩,稳居国内大模型第一梯队;在医疗专业能力上,其基于山海大模型孵化的医疗大模型在CCKS 2023 PromptCBLUE医疗大模型评测中夺得通用赛道一等奖,并在MedBench评测中位列全球第一,各项指标全面超越GPT-4。

登顶MMMU评测榜,充分印证了云知声山海多模态大模型在通用能力、专业能力层面的突出实力,也将鞭策云知声持续迭代多模态大模型技术底座,实现大模型技术在多领域场景下的渗透和应用,以技术创新为各行各业带来更多智能化变革。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1800

    文章

    48082

    浏览量

    242143
  • 云知声
    +关注

    关注

    0

    文章

    199

    浏览量

    8491
  • 大模型
    +关注

    关注

    2

    文章

    2781

    浏览量

    3432

原文标题:引领多模态大模型新高度,山海UniGPT-mMed登顶MMMU权威测评榜

文章出处:【微信号:云知声,微信公众号:云知声】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    腾讯混元文生图登顶智源FlagEval评测榜首

    近日,北京智源人工智能研究院(BAAI)发布了最新的FlagEval大模型评测排行榜,其中模态模型评测榜单的文生图模型引起了广泛关注。结果
    的头像 发表于 12-25 10:06 433次阅读

    与英内物联签署战略合作协议 探索基于山海模型的多元智慧场景

    ‍‍ 12月6日,(上海)智能科技有限公司(以下简称““)与上海英内物联网科技股份有
    的头像 发表于 12-06 20:05 988次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>与英内物联签署战略合作协议 探索基于<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>的多元智慧场景

    荣登2024大模型企业TOP50榜单

    近日,智领未来·向新而行—2024人工智能大模型产业大会在京召开,会上揭晓2024大模型企业TOP50榜单,荣登榜单,
    的头像 发表于 11-29 17:52 651次阅读

    基于AX650N/AX630C部署模态模型InternVL2-1B

    InternVL2是由上海人工智能实验室OpenGVLab发布的一款模态模型,中文名称为“书生·万象”。该模型在多学科问答(MMMU)等
    的头像 发表于 11-18 17:32 1169次阅读
    基于AX650N/AX630C部署<b class='flag-5'>多</b><b class='flag-5'>模态</b>大<b class='flag-5'>模型</b>InternVL2-1B

    山海模型多项能力全球领跑

    国内人工智能权威机构清华大学基础模型研究中心发布SuperBench九月综合榜单。本次评测选取海内外24个具有代表性的大模型,结果显示,山海模型对齐、智能体、安全等多项能力全球领跑。
    的头像 发表于 10-12 14:30 536次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>多项能力全球领跑

    山海模型医疗专业能力全球第一

    近日,由上海AI实验室和上海市数字医学创新中心联合推出的MedBench评测更新榜单,继4月份夺冠后,山海模型医疗行业版(
    的头像 发表于 09-19 15:47 516次阅读

    山海模型助力司法领域智慧化升级

    近期,成功助力上海市徐汇区虹梅街道司法所打造基于山海模型的司法领域应用,极大提升了司法服务的可及性与便利性。这不仅是
    的头像 发表于 09-12 14:44 695次阅读

    山海模型位居全球大模型第一梯队

    SuperCLUE发布《中文大模型基准测评2024上半年报告》,报告选取国内外有代表性的33个大模型在6月份的版本,通过多维度综合性测评,对国内外大
    的头像 发表于 09-12 14:41 719次阅读

    推出山海模态模型

    在人工智能技术的浩瀚星海中,模态交互技术正成为引领未来的新航标。继OpenAI的GPT-4o掀起滔天巨浪后,以创新之姿,推出了其匠心
    的头像 发表于 08-27 15:20 474次阅读

    在边缘侧大模型技术探索和应用

    解决的课题。 2024高工智能汽车开发者大会暨舱驾智能与跨域论坛上,智慧座舱解决方案中心总经理鲍晴峰以《边缘侧大模型带来智能座舱交互新体验》为题,分享了
    的头像 发表于 06-29 15:30 970次阅读

    携手耘途教育成立学院福建分院

    近日,与耘途教育携手,共同成立了学院福建分院,此举标志着双方在智慧教育领域展开了深度合作。根据合作协议,
    的头像 发表于 05-13 10:38 517次阅读

    山海模型医疗行业版登顶上海AI实验室权威大模型评测榜

    近日,上海AI实验室和上海市数字医学创新中心联合推出的MedBench评测更新榜单,山海模型医疗行业版(
    的头像 发表于 04-24 14:28 1955次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>医疗行业版<b class='flag-5'>登顶</b>上海AI实验室权威大<b class='flag-5'>模型</b>评测榜

    山海模型再赴港IPO

    智能科技股份有限公司(简称“”)于3月15日更新了招股书,继续其在港交所主板上市的步
    的头像 发表于 03-22 14:51 820次阅读

    推进港交所主板上市进程

    近日,智能科技股份有限公司(以下简称“”)再次更新招股书,继续其在港交所主板上市的征
    的头像 发表于 03-22 14:45 1201次阅读

    再闯港股IPO

    近日,备受瞩目的智能科技股份有限公司(以下简称)再次更新了其招股书,继续稳步推进其在
    的头像 发表于 03-22 14:42 807次阅读