0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用技术望远镜看国内大模型:文心闪耀 双榜领跑

脑极体 来源:脑极体 作者:脑极体 2024-06-20 09:18 次阅读

中国大模型应用,正在进入“可观测期”。

《中国大模型中标项目监测报告(2024年5月)》中显示,截至5月,中国大模型的相关中标金额已经超过2023年全部中标项目的披露金额。

在大模型全面落地四处开花的同时,大模型正摆脱“不可观测”状态,过去由于大量大模型应用在B端,信息相对封闭,对于产业来说,他们很难清晰获知大模型技术水平、擅长领域、落地能力,无形中增加了智慧化转型的决策成本。

随着大模型技术评测体系的逐渐成熟,我们仿佛拥有了天文望远镜,可以在群星闪耀中,找到那颗最耀眼的星。

wKgaomZy5EmAdGz7AAHqWvqZB6I677.jpg

最近,国际权威机构IDC发布了《中国大模型市场主流产品评估,2024》,智源研究院打造的FlagEval天秤大模型评测平台也发布了最新一期模型评测排行榜单,两项评测中百度文心大模型实现了双榜夺魁。

“望远镜”背后技术评价机制

我们可以简单看看,这两架“天文望远镜”分别采用了哪些评价机制。

IDC的评估分为基础能力和应用能力,其中基础方面涉及问答、推理、创作、数学、代码等能力,应用方面既考验toC通用场景,也考验金融、零售、法律等toB细分场景。

尽管有GPT-4这样的有力对手,文心一言仍然在七大维度全面领先。

智源研究院打造的FlagEval天秤大模型测评平台发布于2023年,面向视频、语音、多模态等多个领域,在FlagEval大语言模型评测体系当前包含6大评测任务,近30个评测数据集,超10万道评测题目。

wKgZomZy5EqAWk23AAIWRF-cRCQ209.jpg

在闭源对话模型榜单中,文心大模型4.0以89.72的综合评分排名第一,OpenAI的GPT-4o等位列其后。

wKgaomZy5EqAWnKiAAESNkipxcs831.jpg

可见不论是从全领域能力角度进行评估,还是考察至关重要的大语言水平,文心一言毫无疑问都是中文大模型的榜首,是星海中光芒最耀眼的一颗。

技术之光

抬头仰望星空时,我们看到的,其实是星星几年,甚至几十几百年以前留下的掠影。

同样,想要让大模型从“不可观测”变为“可观测”,除了对当下的技术能力进行评测,我们也要回溯光芒的源头,也就是大模型的技术内核。

从文心大模型来看,这种技术之光可以分为两个层面:

第一层,是技术投入的“原生光芒”。

百度对于深度学习的探索挖掘,包括对AI技术的应用,已经有十数年之久。在大模型热还未被掀起的2019年,百度就打造了第一代文心大模型体系,从而才有了建立在文心大模型之上的文心一言。

如今经过数次迭代,文心大模型在理解、生成、逻辑、记忆四大能力让其他厂商难以望其项背。IDC报告中就显示,在数学类和代码类等考验模型逻辑、推理等能力的评测中,百度文心大模型体现出了强大的体系化思维、逻辑思维和抽象思维能力。

能力迭代背后,是文心大模型有条不紊的全面技术布局。

比如通过文心飞桨的联合调优,通过高效算力和自研框架来提升大模型的训练效率,增加技术的迭代速度。

wKgaomZy5EuACxItAAKOMedpYks364.jpg

又比如面对近年来爆火的智能体Agent技术,文心大模型第一时间推出了文心智能体平台。在基础模型能力上叠加思考增强训练,以基础模型+思考模型的形式,让大模型更接近于人类的学习、理解和执行模式。

像百度自己,就通过这种模式打造了代码智能体和智能代码助手Comate,目前Comate生成代码整体采纳率已达46%,新增代码中生成比例已达27%。IDC的报告中我们也能发现,在代码类所有6个细分维度中,百度均入围优势厂商。

对于技术研发的深埋与前瞻,让这颗星体源源不断的释放着创新之火,点亮宇宙的一隅。

第二层,是产业协作的“折射光芒”。

文心大模型能力的来源,除了自身的研发投入,还有广泛的产业实践。

截至目前,文心一言累计用户规模已达2亿,日均调用量也达到了2亿。这一数字在同类生成式AI产品中一骑绝尘。

在toB领域,百度一方面将文心大模型全面落地于自身业务中,如搜索、地图、信息流。同时百度智能云还推出了千帆大模型平台,打造一站式企业级大模型开发平台。不久前,文心大模型还对外免费开放了ERNIE Speed、ERNIE Lite两款主力模型。

wKgZomZy5EuAfhBEAAInXsHC8Uo866.jpg

在不断对外开放的过程中,文心大模型的调用量呈几何式增长,合作伙伴与案例也越来越多。从国家电网、南方电网、中国航天这样的国之重器,到金融保险领域的浦发银行、泰康保险,再到终端领域的荣耀、三星,媒体领域汽车之家……在不断与合作伙伴共建行业大模型的过程中,文心大模型已经实现了中国最为广泛的产业落地规模。

在广泛的产业合作中,文心大模型得以被真实应用场景滋养,不断从中发掘细节需求,进而针对性地提升技术能力。

举例来说,在大量的实践中百度得以发掘,大模型落地过程中,效果、效率和成本都是重要考量。因此,推出了多模型推理技术来提升推理效率,以降低落地成本。

有对周围产业伙伴光芒的“折射”,我们观测到的星光可以更加立体。文心大模型的成就不仅仅来自机构评测的认可,更来自一个个坚实的落地案例。

大模型星光如何照耀产业星球

当我们望见星光时,它正在向轨道更远处运行着,从大模型元年,走入了大模型落地元年。

《中国大模型中标项目监测报告(2024年5月)》中显示,今年5月份大模型中标项目数量创下了新高。毫无疑问,随着大模型“不可观测性”逐渐褪去,产业对于大模型的需求,正在进入井喷状态。需求暴涨的情况下,大模型要如何站稳潮头,真正在行业领域站稳脚跟?以文心大模型为例,纵观文心大模型近一年来的动作,仿佛是一场星际旅行,不断从遥远的技术天空贴近我们所在的应用星球。

文心大模型留下了技术的轨迹,通过不断的研发,让大模型更加贴近AGI,在能力层面更适应应用领域的复杂任务。

文心大模型也留下了普惠的轨迹,主力模型的免费开放,落地成本的不断降低,都让大模型更加易用,让更多产业伙伴加入行业大模型的联合创新中。

文心大模型还留下了生态的轨迹,百度对于开发者生态的建设持之以恒,目前已在全国最大AI社区“星河社区”中打造了大模型板块,也推出了智能体平台这样降低大模型应用研发门槛的工具。开发生态的繁荣,让文心具备更多引力,加速向产业目标行驶而去。

有了这三道清晰的轨迹,我们也就能够望见文心,包括整体中国大模型的未来将如何到来。

星移斗转中,产业对于大模型能力与价值的认知正在逐渐清晰。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30637

    浏览量

    268821
  • 文心一言
    +关注

    关注

    0

    文章

    124

    浏览量

    1275
  • 大模型
    +关注

    关注

    2

    文章

    2405

    浏览量

    2621
收藏 人收藏

    评论

    相关推荐

    李彦宏宣布:百度模型日调用量超15亿

    在百度世界2024大会上,百度公司创始人李彦宏宣布了一项令人瞩目的数据:百度模型的日调用量已经超过15亿次。这一数据不仅彰显了百度在人工智能领域的领先地位,也预示着人工智能技术
    的头像 发表于 11-12 10:40 198次阅读

    【附实操视频】聆思CSK6大模型开发板接入国内主流大模型(星火大模型一言、豆包、kimi、智谱glm、通义千问)

    接入一言、通义千问、豆包、智谱glm、kimi等国内的大模型,但由于各家接口和数据格式不一样,调试验证会浪费很多时间。因此本篇以聆思CSK6大
    发表于 08-22 10:12

    百度模型4.0免费了 百度心智能体平台免费开放模型4.0

    据悉;7月5日起 百度心智能体平台(AgentBuilder) 免费开放模型4.0。 开发者在心智能体平台上制作智能体时; 可灵活
    的头像 发表于 07-06 17:12 1216次阅读

    百度发布模型4.0 Turbo与飞桨框架3.0,引领AI技术新篇章

    SUMMIT深度学习开发者大会2024上,向世界展示了百度在AI领域的最新成果——模型4.0 Turbo和飞桨框架3.0,并详细披露了飞桨
    的头像 发表于 06-29 16:03 617次阅读

    百度模型4.0 Turbo,正式发布 用户规模已达3亿

    的最新数据,并正式发布模型4.0 Turbo、飞桨框架3.0等最新技术,披露飞桨生态最
    的头像 发表于 06-29 10:06 848次阅读

    红外热成像望远镜的新突破----华感科技Mile 2系列

    杭州2024年5月17日 /美通社/ -- 华感科技Mile 2热成像望远镜,是华感2024年最新产品。不久前,华感Mile 2从几千件参赛作品中脱颖而出,一举斩获2024年德国红点设计奖。这一全新
    的头像 发表于 05-22 11:33 472次阅读

    百度模型扩展合作领域

    百度创始人兼CEO李彦宏在2024年第一季度财报电话会上宣布,模型API在继与中国三星、荣耀成功合作后,本季度再度实现重要突破。小米、OPPO、vivo等主流手机厂商已全面接入
    的头像 发表于 05-17 11:17 555次阅读

    百度首席技术官王海峰解读模型的关键技术和最新进展

    4月16日,以“创造未来”为主题的Create 2024百度AI开发者大会在深圳国际会展中心成功举办。百度首席技术官王海峰以“技术筑基,星河璀璨”为题,发表演讲,解读了智能体、代码、多模型等多项
    的头像 发表于 04-18 09:20 689次阅读
    百度首席<b class='flag-5'>技术</b>官王海峰解读<b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>的关键<b class='flag-5'>技术</b>和最新进展

    李彦宏:开源模型将逐渐滞后,模型提升训练与推理效率

    李彦宏解释道,百度自研的基础模型—— 4.0,能够根据需求塑造出适应各类场景的微型版模型,并支持精细调整以及后预训练。相较于直接使用开源模型
    的头像 发表于 04-16 14:37 437次阅读

    优必选宣布人形机器人Walker S接入百度模型

    优必选宣布人形机器人Walker S接入百度模型,共同探索中国AI大模型+人形机器人的应用。
    的头像 发表于 04-07 10:17 902次阅读

    欧空局完成欧几里得太空望远镜除冰,提升观测分辨率

    作为总投入高达16亿美元(当前约合115.36亿元人民币)的计划,“欧几里得”太空望远镜旨在深入探究过去100亿年间宇宙进化历程以及人类至今仍未揭示的暗物质与暗能量奥秘。
    的头像 发表于 03-21 15:38 564次阅读

    AIMS望远镜:引领太阳磁场观测的革命性中红外观测系统

    AIMS望远镜是国家自然科学基金委员会支持的重大仪器专项(部委推荐)项目,落户于平均海拔约4000米的青海省海西蒙古族藏族自治州茫崖市冷湖镇赛什腾山D平台。
    的头像 发表于 01-26 10:50 531次阅读

    电磁波如何探测?

    的电磁波探测方法以及常见的电磁波探测设备: 无线电望远镜(天文望远镜)和天线:用于观测无线电波,可以探测到宇宙中的射电源。用于探测射电波、微波、红外线、可见光等不同波段的电磁波。不同类型的望远镜和天线被设计
    的头像 发表于 01-03 09:17 2613次阅读

    世界首台多通道巡天望远镜建成

    望远镜行业资讯
    北京中科同志科技股份有限公司
    发布于 :2023年12月29日 09:46:26

    百度模型首批通过大模型标准符合性测试

    12月22日,在全国信息技术标准化技术委员会人工智能分委会全体会议上,百度模型首批通过大模型
    的头像 发表于 12-28 11:33 618次阅读
    百度<b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>首批通过大<b class='flag-5'>模型</b>标准符合性测试