智源研究院揭晓大模型测评结果，豆包与百川智能大模型表现优异-电子发烧友网

5月18日，北京智源研究院发布了关于国内外各类开/闭源语言及多模态大模型性能评估的最新研究成果。此项研究覆盖了140余个语言模型的综合实力对比，包括其对中文文本理解和多模态图文问答等任务的处理能力。

研究发现，尽管国内头部语言模型在中文环境中的整体表现已接近国际一流水平，但仍存在能力发展不平衡的问题。

在多模态理解图文问答任务中，开源和闭源模型表现相当，而国产模型则表现出色。此外，在中文语境下的文生图能力方面，国产多模态模型与国际一流水平的差距相对较小。

具体到语言模型的排名，在中文语境下，字节跳动的豆包Skylark2以及OpenAI的GPT-4分别名列第一和第二。值得注意的是，国产大模型在理解中国用户需求方面具有明显优势。

在语言模型客观评价中，OpenAI的GPT-4和百川智能的Baichuan3分列第一和第二。同时，百度的文心一言4.0、智谱华章的GLM-4以及月之暗面的Kimi也跻身语言模型主客观评价的前五名。

在多模态理解模型的客观评价中，图文问答方面，阿里巴巴的通义Qwen-vl-max和上海人工智能实验室的InternVL-Chat-V1.5在某些指标上超越了OpenAI的GPT-4，LLaVA-Next-Yi-34B和上海人工智能实验室的Intern-XComposer2-VL-7B紧随其后。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

开源

开源

+关注

关注
3

文章
3372

浏览量
42593
模型

模型

+关注

关注
1

文章
3274

浏览量
48953
大模型

大模型

+关注

关注
2

文章
2493

浏览量
2897

浪潮信息与智源研究院携手共建大模型多元算力生态

近日，浪潮信息与北京智源人工智能研究院正式签署战略合作协议，双方将紧密合作，共同构建大模型多元算力开源创新生态。此次合作旨在提升大模型创新

发表于 12-31 11:49 •253次阅读

浪潮信息与智源研究院达成战略合作协议

近日，浪潮信息与智源研究院达成战略合作协议，双方将紧密协作共建大模型多元算力开源创新生态，提升大模型创新研发的算力效率，降低大模型应用开发的

发表于 12-26 10:25 •191次阅读

百川智能发布Baichuan4-Finance金融大模型

近日，百川智能正式推出了其全链路领域增强的金融大模型——Baichuan4-Finance。这一创新产品的发布，标志着百川智能在金融

发表于 12-25 10:11 •207次阅读

百川智能发布一站式大模型商业化解决方案

近日，百川智能正式推出了一站式大模型商业化解决方案，旨在为企业提供更加全面、高效的大模型应用服务。该解决方案以1+3产品矩阵为核心，包括全链路优质通用训练数据、Baichuan4-Tu

发表于 11-01 18:01 •852次阅读

【附实操视频】聆思CSK6大模型开发板接入国内主流大模型（星火大模型、文心一言、豆包、kimi、智谱glm、通义千问）

输出的结果进行语音合成实现端侧播报。目前已经接通文心一言、豆包、kimi、智谱glm、通义千问等国内主流大模型，详细模板和操作步骤可以参考附件文档。

发表于 08-22 10:12

智能硬件接入主流大模型做语音交互（附文心一言、豆包、kimi、智谱glm、通义千问示例）

本帖最后由 jf_40317719 于 2024-8-21 19:17 编辑多模态交互离不开硬件载体，近期有不少开发者在研究聆思CSK6大模型开发板除了使用出厂示例自带的星火大模型，能不能

发表于 08-21 19:13

摩尔线程携手智源研究院完成基于Triton的大模型算子库适配

近日，摩尔线程与北京智源人工智能研究院（简称：智源研究院）已顺利完成基于Triton语言的高性能算子库FlagGems的适配工作。得益于摩尔

发表于 08-02 11:06 •910次阅读

大模型厂商“输血”不断，百川智能完成50亿元A轮融资！

有重磅消息曝出：知名大模型公司百川智能已经成功收获了价值50亿元的A轮融资。由此，我们不禁感叹，大模型厂商们的“输血”和“续命”之战，还在激烈的上演着。

发表于 07-31 14:47 •642次阅读

大<b class='flag-5'>模型</b>厂商“输血”不断，<b class='flag-5'>百川</b><b class='flag-5'>智能</b>完成50亿元A轮融资！

百川智能完成50亿元A轮融资

近日，国内领先的医疗AI大模型企业——百川智能，正式宣布完成了高达50亿元人民币的A轮融资，这一里程碑式的融资不仅彰显了市场对其技术实力与未来发展潜力的高度认可，也为公司的后续发展奠定了坚实的资金基础。

发表于 07-26 16:42 •484次阅读

亚马逊云科技接入百川智能和零一万物基础模型

近日，亚马逊云科技在中国峰会上宣布，两大中文基础模型——百川智能的Baichuan2-7B和零一万物的Yi-1.5 6B/9B/34B，即将或已正式登陆中国区域的SageMaker JumpStart。这一举措为中国企业提供了丰

发表于 06-04 11:53 •587次阅读

百川智能发布Baichuan 4大模型及首款AI助手“百小应”

百川智能近日发布了其新一代基座大模型Baichuan 4，并同步推出了首款AI助手“百小应”。这款AI助手是在Baichuan 4强大能力的基础上，结合先进的搜索技术精心打造而成。

发表于 05-23 14:15 •636次阅读

中文大模型测评基准SuperCLUE：商汤日日新5.0，刷新国内最好成绩

日前，中文大模型测评基准SuperCLUE发布最新榜单，对商汤科技全新升级「日日新SenseNova 5.0」大模型进行了全方位综合性测评，结果

发表于 05-21 14:45 •786次阅读

百川智能与北京大学将共建通用人工智能联合实验室

近日，百川智能与北京大学携手合作，共同签署了“北大——百川通用人工智能联合实验室”的共建协议，标志着双方在人工智能领域迈出了坚实的合作步伐。

发表于 03-21 11:45 •925次阅读

数势联动百川，发布首批大模型联合解决方案，推动中国大模型价值落地

近日，行业领先的数据智能产品提供商北京数势云创科技有限公司（以下简称“数势科技”）和国内通用大模型厂商北京百川智能科技有限公司（以下简称“百川

发表于 02-28 11:40 •496次阅读

百川智能发布超千亿大模型Baichuan 3

百川智能近日发布了超千亿参数的大语言模型Baichuan 3，引发了业界的广泛关注。这款模型在多个权威通用能力评测中表现卓越，展现了其强大的

发表于 01-31 14:58 •878次阅读

搜索历史

智源研究院揭晓大模型测评结果，豆包与百川智能大模型表现优异

评论