0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智源研究院揭晓大模型测评结果,豆包与百川智能大模型表现优异

微云疏影 来源:综合整理 作者:综合整理 2024-05-20 09:26 次阅读

5月18日,北京智源研究院发布了关于国内外各类开/闭源语言及多模态大模型性能评估的最新研究成果。此项研究覆盖了140余个语言模型的综合实力对比,包括其对中文文本理解和多模态图文问答等任务的处理能力。

研究发现,尽管国内头部语言模型在中文环境中的整体表现已接近国际一流水平,但仍存在能力发展不平衡的问题。

在多模态理解图文问答任务中,开源和闭源模型表现相当,而国产模型则表现出色。此外,在中文语境下的文生图能力方面,国产多模态模型与国际一流水平的差距相对较小。

具体到语言模型的排名,在中文语境下,字节跳动的豆包Skylark2以及OpenAI的GPT-4分别名列第一和第二。值得注意的是,国产大模型在理解中国用户需求方面具有明显优势。

在语言模型客观评价中,OpenAI的GPT-4和百川智能的Baichuan3分列第一和第二。同时,百度的文心一言4.0、智谱华章的GLM-4以及月之暗面的Kimi也跻身语言模型主客观评价的前五名。

在多模态理解模型的客观评价中,图文问答方面,阿里巴巴的通义Qwen-vl-max和上海人工智能实验室的InternVL-Chat-V1.5在某些指标上超越了OpenAI的GPT-4,LLaVA-Next-Yi-34B和上海人工智能实验室的Intern-XComposer2-VL-7B紧随其后。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    3372

    浏览量

    42593
  • 模型
    +关注

    关注

    1

    文章

    3274

    浏览量

    48953
  • 大模型
    +关注

    关注

    2

    文章

    2493

    浏览量

    2897
收藏 人收藏

    评论

    相关推荐

    浪潮信息与智研究院携手共建大模型多元算力生态

    近日,浪潮信息与北京智人工智能研究院正式签署战略合作协议,双方将紧密合作,共同构建大模型多元算力开源创新生态。 此次合作旨在提升大模型创新
    的头像 发表于 12-31 11:49 253次阅读

    浪潮信息与智研究院达成战略合作协议

    近日,浪潮信息与智研究院达成战略合作协议,双方将紧密协作共建大模型多元算力开源创新生态,提升大模型创新研发的算力效率,降低大模型应用开发的
    的头像 发表于 12-26 10:25 191次阅读

    百川智能发布Baichuan4-Finance金融大模型

    近日,百川智能正式推出了其全链路领域增强的金融大模型——Baichuan4-Finance。这一创新产品的发布,标志着百川智能在金融
    的头像 发表于 12-25 10:11 207次阅读

    百川智能发布一站式大模型商业化解决方案

    近日,百川智能正式推出了一站式大模型商业化解决方案,旨在为企业提供更加全面、高效的大模型应用服务。该解决方案以1+3产品矩阵为核心,包括全链路优质通用训练数据、Baichuan4-Tu
    的头像 发表于 11-01 18:01 852次阅读

    【附实操视频】聆思CSK6大模型开发板接入国内主流大模型(星火大模型、文心一言、豆包、kimi、智谱glm、通义千问)

    输出的结果进行语音合成实现端侧播报。 目前已经接通文心一言、豆包、kimi、智谱glm、通义千问等国内主流大模型,详细模板和操作步骤可以参考附件文档。
    发表于 08-22 10:12

    智能硬件接入主流大模型做语音交互(附文心一言、豆包、kimi、智谱glm、通义千问示例)

    本帖最后由 jf_40317719 于 2024-8-21 19:17 编辑 多模态交互离不开硬件载体,近期有不少开发者在研究聆思CSK6大模型开发板除了使用出厂示例自带的星火大模型,能不能
    发表于 08-21 19:13

    摩尔线程携手智研究院完成基于Triton的大模型算子库适配

    近日,摩尔线程与北京智人工智能研究院(简称:智研究院)已顺利完成基于Triton语言的高性能算子库FlagGems的适配工作。得益于摩尔
    的头像 发表于 08-02 11:06 910次阅读

    模型厂商“输血”不断,百川智能完成50亿元A轮融资!

    有重磅消息曝出:知名大模型公司百川智能已经成功收获了价值50亿元的A轮融资。由此,我们不禁感叹,大模型厂商们的“输血”和“续命”之战,还在激烈的上演着。
    的头像 发表于 07-31 14:47 642次阅读
    大<b class='flag-5'>模型</b>厂商“输血”不断,<b class='flag-5'>百川</b><b class='flag-5'>智能</b>完成50亿元A轮融资!

    百川智能完成50亿元A轮融资

    近日,国内领先的医疗AI大模型企业——百川智能,正式宣布完成了高达50亿元人民币的A轮融资,这一里程碑式的融资不仅彰显了市场对其技术实力与未来发展潜力的高度认可,也为公司的后续发展奠定了坚实的资金基础。
    的头像 发表于 07-26 16:42 484次阅读

    亚马逊云科技接入百川智能和零一万物基础模型

    近日,亚马逊云科技在中国峰会上宣布,两大中文基础模型——百川智能的Baichuan2-7B和零一万物的Yi-1.5 6B/9B/34B,即将或已正式登陆中国区域的SageMaker JumpStart。这一举措为中国企业提供了丰
    的头像 发表于 06-04 11:53 587次阅读

    百川智能发布Baichuan 4大模型及首款AI助手“小应”

    百川智能近日发布了其新一代基座大模型Baichuan 4,并同步推出了首款AI助手“小应”。这款AI助手是在Baichuan 4强大能力的基础上,结合先进的搜索技术精心打造而成。
    的头像 发表于 05-23 14:15 636次阅读

    中文大模型测评基准SuperCLUE:商汤日日新5.0,刷新国内最好成绩

    日前,中文大模型测评基准SuperCLUE发布最新榜单,对商汤科技全新升级「日日新SenseNova 5.0」大模型进行了全方位综合性测评结果
    的头像 发表于 05-21 14:45 786次阅读
    中文大<b class='flag-5'>模型</b><b class='flag-5'>测评</b>基准SuperCLUE:商汤日日新5.0,刷新国内最好成绩

    百川智能与北京大学将共建通用人工智能联合实验室

    近日,百川智能与北京大学携手合作,共同签署了“北大——百川通用人工智能联合实验室”的共建协议,标志着双方在人工智能领域迈出了坚实的合作步伐。
    的头像 发表于 03-21 11:45 925次阅读

    数势联动百川,发布首批大模型联合解决方案,推动中国大模型价值落地

    近日,行业领先的数据智能产品提供商北京数势云创科技有限公司(以下简称“数势科技”)和国内通用大模型厂商北京百川智能科技有限公司(以下简称“百川
    的头像 发表于 02-28 11:40 496次阅读
    数势联动<b class='flag-5'>百川</b>,发布首批大<b class='flag-5'>模型</b>联合解决方案,推动中国大<b class='flag-5'>模型</b>价值落地

    百川智能发布超千亿大模型Baichuan 3

    百川智能近日发布了超千亿参数的大语言模型Baichuan 3,引发了业界的广泛关注。这款模型在多个权威通用能力评测中表现卓越,展现了其强大的
    的头像 发表于 01-31 14:58 878次阅读