用技术望远镜看国内大模型：文心闪耀双榜领跑-电子发烧友网

中国大模型应用，正在进入“可观测期”。

《中国大模型中标项目监测报告（2024年5月）》中显示，截至5月，中国大模型的相关中标金额已经超过2023年全部中标项目的披露金额。

在大模型全面落地四处开花的同时，大模型正摆脱“不可观测”状态，过去由于大量大模型应用在B端，信息相对封闭，对于产业来说，他们很难清晰获知大模型技术水平、擅长领域、落地能力，无形中增加了智慧化转型的决策成本。

随着大模型技术评测体系的逐渐成熟，我们仿佛拥有了天文望远镜，可以在群星闪耀中，找到那颗最耀眼的星。

最近，国际权威机构IDC发布了《中国大模型市场主流产品评估，2024》，智源研究院打造的FlagEval天秤大模型评测平台也发布了最新一期模型评测排行榜单，两项评测中百度文心大模型实现了双榜夺魁。

“望远镜”背后技术评价机制

我们可以简单看看，这两架“天文望远镜”分别采用了哪些评价机制。

IDC的评估分为基础能力和应用能力，其中基础方面涉及问答、推理、创作、数学、代码等能力，应用方面既考验toC通用场景，也考验金融、零售、法律等toB细分场景。

尽管有GPT-4这样的有力对手，文心一言仍然在七大维度全面领先。

智源研究院打造的FlagEval天秤大模型测评平台发布于2023年，面向视频、语音、多模态等多个领域，在FlagEval大语言模型评测体系当前包含6大评测任务，近30个评测数据集，超10万道评测题目。

在闭源对话模型榜单中，文心大模型4.0以89.72的综合评分排名第一，OpenAI的GPT-4o等位列其后。

可见不论是从全领域能力角度进行评估，还是考察至关重要的大语言水平，文心一言毫无疑问都是中文大模型的榜首，是星海中光芒最耀眼的一颗。

技术之光

抬头仰望星空时，我们看到的，其实是星星几年，甚至几十几百年以前留下的掠影。

同样，想要让大模型从“不可观测”变为“可观测”，除了对当下的技术能力进行评测，我们也要回溯光芒的源头，也就是大模型的技术内核。

从文心大模型来看，这种技术之光可以分为两个层面：

第一层，是技术投入的“原生光芒”。

百度对于深度学习的探索挖掘，包括对AI技术的应用，已经有十数年之久。在大模型热还未被掀起的2019年，百度就打造了第一代文心大模型体系，从而才有了建立在文心大模型之上的文心一言。

如今经过数次迭代，文心大模型在理解、生成、逻辑、记忆四大能力让其他厂商难以望其项背。IDC报告中就显示，在数学类和代码类等考验模型逻辑、推理等能力的评测中，百度文心大模型体现出了强大的体系化思维、逻辑思维和抽象思维能力。

能力迭代背后，是文心大模型有条不紊的全面技术布局。

比如通过文心飞桨的联合调优，通过高效算力和自研框架来提升大模型的训练效率，增加技术的迭代速度。

又比如面对近年来爆火的智能体Agent技术，文心大模型第一时间推出了文心智能体平台。在基础模型能力上叠加思考增强训练，以基础模型+思考模型的形式，让大模型更接近于人类的学习、理解和执行模式。

像百度自己，就通过这种模式打造了代码智能体和智能代码助手Comate，目前Comate生成代码整体采纳率已达46%，新增代码中生成比例已达27%。IDC的报告中我们也能发现，在代码类所有6个细分维度中，百度均入围优势厂商。

对于技术研发的深埋与前瞻，让这颗星体源源不断的释放着创新之火，点亮宇宙的一隅。

第二层，是产业协作的“折射光芒”。

文心大模型能力的来源，除了自身的研发投入，还有广泛的产业实践。

截至目前，文心一言累计用户规模已达2亿，日均调用量也达到了2亿。这一数字在同类生成式AI产品中一骑绝尘。

在toB领域，百度一方面将文心大模型全面落地于自身业务中，如搜索、地图、信息流。同时百度智能云还推出了千帆大模型平台，打造一站式企业级大模型开发平台。不久前，文心大模型还对外免费开放了ERNIE Speed、ERNIE Lite两款主力模型。

在不断对外开放的过程中，文心大模型的调用量呈几何式增长，合作伙伴与案例也越来越多。从国家电网、南方电网、中国航天这样的国之重器，到金融保险领域的浦发银行、泰康保险，再到终端领域的荣耀、三星，媒体领域汽车之家……在不断与合作伙伴共建行业大模型的过程中，文心大模型已经实现了中国最为广泛的产业落地规模。

在广泛的产业合作中，文心大模型得以被真实应用场景滋养，不断从中发掘细节需求，进而针对性地提升技术能力。

举例来说，在大量的实践中百度得以发掘，大模型落地过程中，效果、效率和成本都是重要考量。因此，推出了多模型推理技术来提升推理效率，以降低落地成本。

有对周围产业伙伴光芒的“折射”，我们观测到的星光可以更加立体。文心大模型的成就不仅仅来自机构评测的认可，更来自一个个坚实的落地案例。

大模型星光如何照耀产业星球

当我们望见星光时，它正在向轨道更远处运行着，从大模型元年，走入了大模型落地元年。

《中国大模型中标项目监测报告（2024年5月）》中显示，今年5月份大模型中标项目数量创下了新高。毫无疑问，随着大模型“不可观测性”逐渐褪去，产业对于大模型的需求，正在进入井喷状态。需求暴涨的情况下，大模型要如何站稳潮头，真正在行业领域站稳脚跟？以文心大模型为例，纵观文心大模型近一年来的动作，仿佛是一场星际旅行，不断从遥远的技术天空贴近我们所在的应用星球。

文心大模型留下了技术的轨迹，通过不断的研发，让大模型更加贴近AGI，在能力层面更适应应用领域的复杂任务。

文心大模型也留下了普惠的轨迹，主力模型的免费开放，落地成本的不断降低，都让大模型更加易用，让更多产业伙伴加入行业大模型的联合创新中。

文心大模型还留下了生态的轨迹，百度对于开发者生态的建设持之以恒，目前已在全国最大AI社区“星河社区”中打造了大模型板块，也推出了智能体平台这样降低大模型应用研发门槛的工具。开发生态的繁荣，让文心具备更多引力，加速向产业目标行驶而去。

有了这三道清晰的轨迹，我们也就能够望见文心，包括整体中国大模型的未来将如何到来。

星移斗转中，产业对于大模型能力与价值的认知正在逐渐清晰。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
30637

浏览量
268821
文心一言

文心一言

+关注

关注
0

文章
124

浏览量
1275
大模型

大模型

+关注

关注
2

文章
2405

浏览量
2621

李彦宏宣布：百度文心大模型日调用量超15亿

在百度世界2024大会上，百度公司创始人李彦宏宣布了一项令人瞩目的数据：百度文心大模型的日调用量已经超过15亿次。这一数据不仅彰显了百度在人工智能领域的领先地位，也预示着人工智能技术的

发表于 11-12 10:40 •198次阅读

【附实操视频】聆思CSK6大模型开发板接入国内主流大模型（星火大模型、文心一言、豆包、kimi、智谱glm、通义千问）

接入文心一言、通义千问、豆包、智谱glm、kimi等国内的大模型，但由于各家接口和数据格式不一样，调试验证会浪费很多时间。因此本篇以聆思CSK6大模

发表于 08-22 10:12

百度文心大模型4.0免费了百度文心智能体平台免费开放文心大模型4.0

据悉；7月5日起百度文心智能体平台（AgentBuilder）免费开放文心大模型4.0。开发者在文心智能体平台上制作智能体时；可灵活

发表于 07-06 17:12 •1216次阅读

百度发布文心大模型4.0 Turbo与飞桨框架3.0,引领AI技术新篇章

SUMMIT深度学习开发者大会2024上，向世界展示了百度在AI领域的最新成果——文心大模型4.0 Turbo和飞桨框架3.0，并详细披露了飞桨文

发表于 06-29 16:03 •617次阅读

百度文心大模型4.0 Turbo，正式发布用户规模已达3亿

的最新数据，并正式发布文心大模型4.0 Turbo、飞桨框架3.0等最新技术，披露飞桨文心生态最

发表于 06-29 10:06 •848次阅读

红外热成像望远镜的新突破----华感科技Mile 2系列

杭州2024年5月17日 /美通社/ -- 华感科技Mile 2热成像望远镜，是华感2024年最新产品。不久前，华感Mile 2从几千件参赛作品中脱颖而出，一举斩获2024年德国红点设计奖。这一全新

发表于 05-22 11:33 •472次阅读

百度文心大模型扩展合作领域

百度创始人兼CEO李彦宏在2024年第一季度财报电话会上宣布，文心大模型API在继与中国三星、荣耀成功合作后，本季度再度实现重要突破。小米、OPPO、vivo等主流手机厂商已全面接入文

发表于 05-17 11:17 •555次阅读

百度首席技术官王海峰解读文心大模型的关键技术和最新进展

4月16日，以“创造未来”为主题的Create 2024百度AI开发者大会在深圳国际会展中心成功举办。百度首席技术官王海峰以“技术筑基，星河璀璨”为题，发表演讲，解读了智能体、代码、多模型等多项

发表于 04-18 09:20 •689次阅读

李彦宏：开源模型将逐渐滞后，文心大模型提升训练与推理效率

李彦宏解释道，百度自研的基础模型——文心 4.0，能够根据需求塑造出适应各类场景的微型版模型，并支持精细调整以及后预训练。相较于直接使用开源模型

发表于 04-16 14:37 •437次阅读

优必选宣布人形机器人Walker S接入百度文心大模型

优必选宣布人形机器人Walker S接入百度文心大模型，共同探索中国AI大模型+人形机器人的应用。

发表于 04-07 10:17 •902次阅读

欧空局完成欧几里得太空望远镜除冰，提升观测分辨率

作为总投入高达16亿美元（当前约合115.36亿元人民币）的计划，“欧几里得”太空望远镜旨在深入探究过去100亿年间宇宙进化历程以及人类至今仍未揭示的暗物质与暗能量奥秘。

发表于 03-21 15:38 •564次阅读

AIMS望远镜：引领太阳磁场观测的革命性中红外观测系统

AIMS望远镜是国家自然科学基金委员会支持的重大仪器专项（部委推荐）项目，落户于平均海拔约4000米的青海省海西蒙古族藏族自治州茫崖市冷湖镇赛什腾山D平台。

发表于 01-26 10:50 •531次阅读

电磁波如何探测？

的电磁波探测方法以及常见的电磁波探测设备：无线电望远镜(天文望远镜)和天线：用于观测无线电波，可以探测到宇宙中的射电源。用于探测射电波、微波、红外线、可见光等不同波段的电磁波。不同类型的望远镜和天线被设计

发表于 01-03 09:17 •2613次阅读

世界首台多通道巡天望远镜建成

望远镜行业资讯

北京中科同志科技股份有限公司
发布于 :2023年12月29日 09:46:26

百度文心大模型首批通过大模型标准符合性测试

12月22日，在全国信息技术标准化技术委员会人工智能分委会全体会议上，百度文心大模型首批通过大模型

发表于 12-28 11:33 •618次阅读

搜索历史

用技术望远镜看国内大模型：文心闪耀双榜领跑

评论

李彦宏宣布：百度文心大模型日调用量超15亿

【附实操视频】聆思CSK6大模型开发板接入国内主流大模型（星火大模型、文心一言、豆包、kimi、智谱glm、通义千问）

百度文心大模型4.0免费了百度文心智能体平台免费开放文心大模型4.0

百度发布文心大模型4.0 Turbo与飞桨框架3.0,引领AI技术新篇章

百度文心大模型4.0 Turbo，正式发布用户规模已达3亿

红外热成像望远镜的新突破----华感科技Mile 2系列

百度文心大模型扩展合作领域

百度首席技术官王海峰解读文心大模型的关键技术和最新进展

李彦宏：开源模型将逐渐滞后，文心大模型提升训练与推理效率

优必选宣布人形机器人Walker S接入百度文心大模型

欧空局完成欧几里得太空望远镜除冰，提升观测分辨率

AIMS望远镜：引领太阳磁场观测的革命性中红外观测系统

电磁波如何探测？

世界首台多通道巡天望远镜建成

百度文心大模型首批通过大模型标准符合性测试

搜索历史

用技术望远镜看国内大模型：文心闪耀 双榜领跑

评论

用技术望远镜看国内大模型：文心闪耀双榜领跑