0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智源研究院揭晓大模型测评结果,豆包与百川智能大模型表现优异

微云疏影 来源:综合整理 作者:综合整理 2024-05-20 09:26 次阅读

5月18日,北京智源研究院发布了关于国内外各类开/闭源语言及多模态大模型性能评估的最新研究成果。此项研究覆盖了140余个语言模型的综合实力对比,包括其对中文文本理解和多模态图文问答等任务的处理能力。

研究发现,尽管国内头部语言模型在中文环境中的整体表现已接近国际一流水平,但仍存在能力发展不平衡的问题。

在多模态理解图文问答任务中,开源和闭源模型表现相当,而国产模型则表现出色。此外,在中文语境下的文生图能力方面,国产多模态模型与国际一流水平的差距相对较小。

具体到语言模型的排名,在中文语境下,字节跳动的豆包Skylark2以及OpenAI的GPT-4分别名列第一和第二。值得注意的是,国产大模型在理解中国用户需求方面具有明显优势。

在语言模型客观评价中,OpenAI的GPT-4和百川智能的Baichuan3分列第一和第二。同时,百度的文心一言4.0、智谱华章的GLM-4以及月之暗面的Kimi也跻身语言模型主客观评价的前五名。

在多模态理解模型的客观评价中,图文问答方面,阿里巴巴的通义Qwen-vl-max和上海人工智能实验室的InternVL-Chat-V1.5在某些指标上超越了OpenAI的GPT-4,LLaVA-Next-Yi-34B和上海人工智能实验室的Intern-XComposer2-VL-7B紧随其后。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    3126

    浏览量

    42068
  • 模型
    +关注

    关注

    1

    文章

    3032

    浏览量

    48352
  • 大模型
    +关注

    关注

    2

    文章

    2135

    浏览量

    1977
收藏 人收藏

    评论

    相关推荐

    【附实操视频】聆思CSK6大模型开发板接入国内主流大模型(星火大模型、文心一言、豆包、kimi、智谱glm、通义千问)

    输出的结果进行语音合成实现端侧播报。 目前已经接通文心一言、豆包、kimi、智谱glm、通义千问等国内主流大模型,详细模板和操作步骤可以参考附件文档。
    发表于 08-22 10:12

    智能硬件接入主流大模型做语音交互(附文心一言、豆包、kimi、智谱glm、通义千问示例)

    本帖最后由 jf_40317719 于 2024-8-21 19:17 编辑 多模态交互离不开硬件载体,近期有不少开发者在研究聆思CSK6大模型开发板除了使用出厂示例自带的星火大模型,能不能
    发表于 08-21 19:13

    摩尔线程携手智研究院完成基于Triton的大模型算子库适配

    近日,摩尔线程与北京智人工智能研究院(简称:智研究院)已顺利完成基于Triton语言的高性能算子库FlagGems的适配工作。得益于摩尔
    的头像 发表于 08-02 11:06 531次阅读

    模型厂商“输血”不断,百川智能完成50亿元A轮融资!

    有重磅消息曝出:知名大模型公司百川智能已经成功收获了价值50亿元的A轮融资。由此,我们不禁感叹,大模型厂商们的“输血”和“续命”之战,还在激烈的上演着。
    的头像 发表于 07-31 14:47 505次阅读
    大<b class='flag-5'>模型</b>厂商“输血”不断,<b class='flag-5'>百川</b><b class='flag-5'>智能</b>完成50亿元A轮融资!

    百川智能完成50亿元A轮融资

    近日,国内领先的医疗AI大模型企业——百川智能,正式宣布完成了高达50亿元人民币的A轮融资,这一里程碑式的融资不仅彰显了市场对其技术实力与未来发展潜力的高度认可,也为公司的后续发展奠定了坚实的资金基础。
    的头像 发表于 07-26 16:42 352次阅读

    亚马逊云科技接入百川智能和零一万物基础模型

    近日,亚马逊云科技在中国峰会上宣布,两大中文基础模型——百川智能的Baichuan2-7B和零一万物的Yi-1.5 6B/9B/34B,即将或已正式登陆中国区域的SageMaker JumpStart。这一举措为中国企业提供了丰
    的头像 发表于 06-04 11:53 498次阅读

    百川智能发布Baichuan 4大模型及首款AI助手“小应”

    百川智能近日发布了其新一代基座大模型Baichuan 4,并同步推出了首款AI助手“小应”。这款AI助手是在Baichuan 4强大能力的基础上,结合先进的搜索技术精心打造而成。
    的头像 发表于 05-23 14:15 484次阅读

    数势联动百川,发布首批大模型联合解决方案,推动中国大模型价值落地

    近日,行业领先的数据智能产品提供商北京数势云创科技有限公司(以下简称“数势科技”)和国内通用大模型厂商北京百川智能科技有限公司(以下简称“百川
    的头像 发表于 02-28 11:40 374次阅读
    数势联动<b class='flag-5'>百川</b>,发布首批大<b class='flag-5'>模型</b>联合解决方案,推动中国大<b class='flag-5'>模型</b>价值落地

    百川智能发布超千亿大模型Baichuan 3

    百川智能近日发布了超千亿参数的大语言模型Baichuan 3,引发了业界的广泛关注。这款模型在多个权威通用能力评测中表现卓越,展现了其强大的
    的头像 发表于 01-31 14:58 693次阅读

    搜索出生的百川智能模型RAG爬坑之路总结

    今天对百川的RAG方法进行解读,百川智能具有深厚的搜索背景,来看看他们是怎么爬RAG的坑的吧~
    的头像 发表于 01-05 15:02 1285次阅读
    搜索出生的<b class='flag-5'>百川</b><b class='flag-5'>智能</b>大<b class='flag-5'>模型</b>RAG爬坑之路总结

    百川智能发布Baichuan2 Turbo系列API,或将替代行业大模型

    在当天的媒体沟通会上,百川智能创始人、CEO王小百川智能联合创始人、联席总裁洪涛,百川
    的头像 发表于 12-20 16:54 816次阅读

    天数智芯支持智研究院首次完成大模型异构算力混合训练,突破异构算力束缚

    11 月 29 日,北京智人工智能研究院副院长兼总工程师林咏华在 2023 人工智能计算大会上宣布,正式开源 700 亿参数大模型 Aqu
    的头像 发表于 11-30 13:10 2673次阅读
    天数智芯支持智<b class='flag-5'>源</b><b class='flag-5'>研究院</b>首次完成大<b class='flag-5'>模型</b>异构算力混合训练,突破异构算力束缚

    新华社研究院:商汤“商量”获评中国大模型市场未来领袖

    SenseChat ” 在定量实测的情商维度上,位居全部10款大模型第一 , 并在定性评估中入选大模型市场未来领袖象限 。此外,商汤赋能电力AI平台智能化升级的实践,也入围新华社研究院
    的头像 发表于 11-29 18:30 412次阅读
    新华社<b class='flag-5'>研究院</b>:商汤“商量”获评中国大<b class='flag-5'>模型</b>市场未来领袖

    寒武纪的思元(MLU)云端智能加速卡与百川智能完成大模型适配,携手创新生成式AI

    近日,寒武纪思元(MLU)系列云端智能加速卡与百川智能旗下的大模型Baichuan2-53B、Baichuan2-13B、Baichuan2-7B等已完成全面适配,寒武纪思元(MLU)
    的头像 发表于 11-06 20:32 1190次阅读
    寒武纪的思元(MLU)云端<b class='flag-5'>智能</b>加速卡与<b class='flag-5'>百川</b><b class='flag-5'>智能</b>完成大<b class='flag-5'>模型</b>适配,携手创新生成式AI

    百川智能获阿里腾讯小米等3亿美元投资

    百川智能推出了4款开源baichuan-7b/13b、baichuan 2-7b/13b的免费商用产品和baichuan-53b、baichuan 2-53b的闭模型,平均每28天
    的头像 发表于 10-17 10:15 672次阅读