0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云知声山海大模型医疗专业能力全球第一

云知声 来源:云知声 2024-09-19 15:47 次阅读

近日,由上海AI实验室和上海市数字医学创新中心联合推出的MedBench评测更新榜单,继4月份夺冠后,云知声山海大模型医疗行业版(UniGPT-Med)再次以综合得分82.2的优异成绩位列全球第一,各项指标全面超越GPT-4,充分展现出山海大模型在拥有业内一流的通用能力之外,更具备打造世界领先的行业大模型的能力。

MedBench致力于打造一个科学、公平且严谨的中文医疗大模型评测体系及开放平台,其基于医学权威标准,不断更新维护高质量的医学数据集,全方位多维度量化模型在各个医学维度的能力。

MedBench的五大评测维度——医学语言理解、医学语言生成、医学知识问答、复杂医学推理、医疗安全和伦理,构成了其专业评测框架的核心。这一框架吸纳了海量医学知识库和医院医学专家的丰富经验,涵盖8个公开数据集和12个自建数据集,总计约30万道中文医疗专业测评题目,覆盖了从医学考试题库到患者服务、医学问诊、病例分析以及病历生成等广泛的医学任务,致力为中文医疗大模型提供客观科学的性能评测参考。

今年5月,MedBench平台全面升级,不仅引入API评测方式,丰富了参评途径,还优化了开放域问答的评估指标。通过医学专家的精准标注,平台进一步提升了评测结果的公正性和专业性。同时,平台在数据集、评测方法和系统功能等方面也进行了升级,旨在为医疗大模型评测构建一个更加完善的社区环境,并提供更加丰富、真实的实践场景。

此次评测,云知声山海大模型医疗行业版(UniGPT-Med)通过API提交方式,不仅以82.2的综合得分刷新了MedBench评测记录,更是在各个维度上力压GPT-4,排名全球第一。这一成绩的取得,是山海大模型医疗专业能力的集中展现,也标志着其技术迭代和创新发展达到了一个新的高度。

目前,山海大模型通用能力已超越GPT-3.5,并在SuperCLUE 4月评测中跻身国内大模型Top10;与GPT-4的对战中,山海综合胜率与和率为75.55%。

在医疗专业能力上,山海大模型于2023年6月的MedQA任务中超越Med-PaLM 2,取得87.1%的优异成绩;在临床执业医师资格考试中以523分(总分600分)的优异成绩,超过99%的考生水平;其基于山海大模型孵化的医疗行业版大模型,也在CCKS 2023 PromptCBLUE医疗大模型评测中夺得通用赛道一等奖。

随着医疗行业对智能化、精准化服务需求的不断增长,云知声山海大模型医疗行业版(UniGPT-Med)有望在医疗健康领域扮演更加关键的角色,为提升医疗服务效率、优化患者体验、推动医疗科技进步提供强有力的支持。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 医疗
    +关注

    关注

    8

    文章

    1800

    浏览量

    58660
  • 云知声
    +关注

    关注

    0

    文章

    169

    浏览量

    8369
  • 大模型
    +关注

    关注

    2

    文章

    2322

    浏览量

    2477

原文标题:MedBench最新评测:山海大模型医疗专业能力全球第一,各项指标力压GPT-4

文章出处:【微信号:云知声,微信公众号:云知声】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    荣登2024全球AIGC先锋者系列榜单

    近日,由PEC China、至顶科技、软积木主办的“2024 AI创新者大会暨PEC提示工程峰会”在北京举行,会上发布“2024全球AIGC先锋者系列榜单”,入选“2024
    的头像 发表于 11-21 14:14 138次阅读

    山海模型多项能力全球领跑

    国内人工智能权威机构清华大学基础模型研究中心发布SuperBench九月综合榜单。本次评测选取海内外24个具有代表性的大模型,结果显示,山海模型对齐、智能体、安全等多项
    的头像 发表于 10-12 14:30 356次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>多项<b class='flag-5'>能力</b><b class='flag-5'>全球</b>领跑

    山海多模态大模型UniGPT-mMed登顶MMMU测评榜首

    近日,多模态人工智能模型基准评测集MMMU更新榜单,山海多模态大模型UniGPT-mMed
    的头像 发表于 10-12 14:09 254次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b><b class='flag-5'>山海</b>多模态大<b class='flag-5'>模型</b>UniGPT-mMed登顶MMMU测评榜首

    山海模型助力司法领域智慧化升级

    近期,成功助力上海市徐汇区虹梅街道司法所打造基于山海模型的司法领域应用,极大提升了司法服务的可及性与便利性。这不仅是
    的头像 发表于 09-12 14:44 566次阅读

    山海模型位居全球模型第一梯队

    SuperCLUE发布《中文大模型基准测评2024上半年报告》,报告选取国内外有代表性的33个大模型在6月份的版本,通过多维度综合性测评,对国内外大模型发展现状进行观察与思考。
    的头像 发表于 09-12 14:41 564次阅读

    推出山海多模态大模型

    在人工智能技术的浩瀚星海中,多模态交互技术正成为引领未来的新航标。继OpenAI的GPT-4o掀起滔天巨浪后,以创新之姿,推出了其匠心独运的山海多模态大
    的头像 发表于 08-27 15:20 362次阅读

    在边缘侧大模型技术探索和应用

    解决的课题。 2024高工智能汽车开发者大会暨舱驾智能与跨域论坛上,智慧座舱解决方案中心总经理鲍晴峰以《边缘侧大模型带来智能座舱交互新体验》为题,分享了
    的头像 发表于 06-29 15:30 782次阅读

    携手耘途教育成立学院福建分院

    近日,与耘途教育携手,共同成立了学院福建分院,此举标志着双方在智慧教育领域展开了深度合作。根据合作协议,
    的头像 发表于 05-13 10:38 384次阅读

    山海模型医疗行业版登顶上海AI实验室权威大模型评测榜

    近日,上海AI实验室和上海市数字医学创新中心联合推出的MedBench评测更新榜单,山海模型医疗
    的头像 发表于 04-24 14:28 1794次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b><b class='flag-5'>医疗</b>行业版登顶上海AI实验室权威大<b class='flag-5'>模型</b>评测榜

    山海模型再赴港IPO

    智能科技股份有限公司(简称“”)于3月15日更新了招股书,继续其在港交所主板上市的步
    的头像 发表于 03-22 14:51 672次阅读

    再闯港股IPO

    近日,备受瞩目的智能科技股份有限公司(以下简称)再次更新了其招股书,继续稳步推进其在
    的头像 发表于 03-22 14:42 661次阅读

    再闯港股IPO,深耕AI领域

    近日,智能科技股份有限公司(简称:)正式向港交所递交了招股书,计划主板IPO上市。这
    的头像 发表于 03-19 15:36 776次阅读

    山海模型获得华为昇腾技术认证

    山海模型近日取得了重大突破,顺利通过了华为Atlas 800训练服务器和华为AI框架昇思MindSpore的兼容性测试。这
    的头像 发表于 02-05 09:32 958次阅读

    全新推出AIGC内容创作平台蓝藻AI

    近日,基于智能语音技术和山海模型技术,全新推出AIGC内容创作平台——蓝藻AI,为创作者提供AI声音克隆、AI文字配音、AI文案创作
    的头像 发表于 01-10 13:38 769次阅读

    推动医疗产业数字化智能化发展

    由亿欧大健康主办的CHS 2023第八届中国大健康产业升级峰会在北京成功召开,活动现场发布“CHS 2023中国大健康产业榜”系列榜单。凭借在医疗领域的大模型实践探索,
    的头像 发表于 12-25 17:23 778次阅读