0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型,在内卷中寻找出口

脑极体 来源:脑极体 作者:脑极体 2024-12-24 13:39 次阅读

wKgZPGdqSSaAOOaXAAlEWezvcFE608.jpg

2024年,大模型进展不断。从年初的Sora到最新的o3,更新更好的模型不断被推出,“内卷”到底有没有发生?

我们要先确定“内卷”的定义,指某一类产业模式,发展到一种确定形式后,陷入“高水平均衡陷阱”,出现“没有发展的增长”,这种局面一直无法被打破,那就会走向停滞和危机。

而这一年,大模型的scaling law法则越来越受到挑战,训练模型的算力集群已经从万卡发展到十万卡,扩大了十倍,而模型的智商并没有以这个倍率提高。应用端也没有出现killer app(杀手级应用),模型厂商开始了流血换量的价格战……这些特征与“内卷”的定义是契合的。

那么接下来的问题就是,内卷化让大模型陷入危机了吗?以及脱离内卷的出口,究竟在哪里?

wKgZPGdqSSeAXNd2AAIy3GZ21fg543.jpg

在内卷化周期中,一个产业是很难保持活力和创新动力的。大模型内卷化的加剧,也让行业进入调整期。

首先可以感受到的,就是公众和投资者的失望。2023年,人们都用“AI一天,人间一年”来形容AI的发展,美股 “七姐妹”(苹果、微软、谷歌母公司alphabet、亚马逊英伟达特斯拉、Meta)更是在这一股热潮下屡创新高。而近来我们明显看到,这股热情已经回落。

OpenAI的股东、接入模型API的服务商企业,都公开抱怨过,AI能力没有太大进展了。刚刚结束的为期12天的OpenAI 发布会,也大多是对已有模型、产品或技术路线的增强,符合预期,但缺乏亮点,无法为AGI提供强支撑。OpenAI前首席科学家Ilya在NeurIPS 2024大会上提出“预训练将会终结(Pre-training as we know it will end)”,更是给大众浇了一瓢凉水。

来自产学各界的质疑态度是一个比较危险的信号,因为历史上的AI寒冬都源于信心缺失和投资退潮。

另一个危机信号,是产品同质化竞争和淘汰赛加剧。

基础模型的竞赛,也在2024变得格外激烈,一是模型数量过密,且性能表现逐渐趋同,尤其是开源模型与闭源模型的差距在快速缩小,进入同质化竞争。

wKgZO2dqSSeATcDgAAIyio6mX1U778.jpg

二是同一厂商的模型家族,也在加速淘汰,比如GPT-3.5-Turbo就退役了,由GPT-4o mini取代,国内模厂的模型也基本如此,用户都愿意用加量不加价、物美价更廉的新模型,旧模型没人愿意用了。GPT-4o Mini发布后,API 的使用量翻了一番。

激烈的同质化竞争,让模厂不敢减少训练新模型的投入,又为了应对价格战而不得不下调token价格,结果就是经济负担越来越重。可以说,目前大模型无论是外部的宏观形势,还是企业的微观经营状态,都没有2023年那么积极了。

wKgZPGdqSSiAODcVAAIcBbsHvaA648.jpg

模型层面,底层技术路线、数据瓶颈等无法在短期内得到有效突破,那么从商业层面寻找出路,就成为必然。

2024年,我们能看到大模型内卷,给商业模式带来的诸多挑战。

一是云+API模式,流血降价、以价换量并不是最优解。

API调用量付费,是大模型的主要变现模式之一,通过token降价来赢得更多大模型业务上云,获得长期收益,是云厂商价格战的基本逻辑。但目前来看,以价换量似乎并不奏效。

wKgZO2dqSSiANArFAAEx77I9Yl0491.jpg

究其原因,是因为B端客户更关注模厂的长期性、模型质量,质在价先,可靠优先。所以,我们看到,一部分以价换量成功的云厂商,本身就具有比较强的模型能力,比如文心一言两款主力模型免费之后,百度智能云的日调用量一个月翻了十倍。基于豆包大模型家族的火山云,token调用量也大幅上升,甚至有客户的tokens调用量增长了5000倍。这说明新用户会倾向于头部模型,而老用户要么不考虑替换现有模型,要么会把鸡蛋放在多个头部厂商的篮子里,趁降价接入更多模型,最终留下性价比高的。而不打价格战的云厂商,比如华为云将盘古大模型作为“尖刀产品”,也在B端市场取得了不错的成绩,与行业伙伴协同打造的煤炭大模型、医药大模型及数智化解决方案,今年在垂直领域的多个企业内被复用。很多行业用户考虑华为云,就有企业抗风险能力强,能在基础模型坚持投入,业务稳健运营的预期考量。

上述企业说明,云+API模式成功的根本,是“质在价先”

二是订阅制,由于大模型内卷化,导致用户粘性低、忠诚度不高,会员市场呈现出极高的分散性。

因为大模型的更新换代非常快,一方面新模型在质量和性价比上往往更好,“等等党”更愿意观望;另外很多旧模型会不再更新或退役,这就让会员更不愿意跟平台长期绑定。这就导致模厂为了不断吸引新用户,拉新营销活动难以停止,获客成本居高不下,而且影响用户体验,需要高频弹窗广告,打扰用户,开发出多个会员等级和收费权益套餐,增加了用户的决策疲劳。而好不容易拉来的新客户,往往使用一段时间之后就转向免费版本,或者更新更便宜的友商产品,长期续费率不高。

可以看到,大模型的内卷化,导致大多数模厂难以说服客户和开发者,与其建立长期信赖关系。这就给后续的商业变现与价值挖掘,造成了极大挑战。

wKgZO2dqSSmAAQ3vAAJvYKdctAg745.jpg

告别内卷,就要向外寻找出路。数量多、同质化的大模型,形成了一个密度很高的堰塞湖。那么逃离内卷,就必须疏浚河道,缓解拥塞。所以,2025,将是大模型商业基础设施日趋完善的一年,通过更全面的“水利设施”,让大模型应用者和开发者们能够更方便地取用。

如何判断一个大模型是否“外向”?有以下几个衡量标准:

一是模型的开放度或者说兼容性。

如前所说,内卷化周期中,用户并不愿意将鸡蛋放在一个篮子里,或者跟某一个模厂进行长期绑定,这就需要模型具备很强的开放度和兼容性。比如腾讯混元大模型的免费资源包,同时支持hunyuan-pro、hunyuan-standard、hunyuan-turbo等多个模型共享,支撑第三方平台、ISV服务商为客户提供多种模型的灵活选择与切换、模型竞技场等,来满足最终客户对多元多模的需求。

wKgZPGdqSSqAKzVMAAGbfzK6KOc199.jpg

二是更细致地开发工具。

将大模型技术转化为生产力,还需要加工工具、工作流等更细致的支持,比如此次OpenAI就为Sora打造了Remix、Blend和Loop三个专业工具,来支撑更好的视频生成,为此支付每月200美元的Pro用户也不少。国内,我们实测过的,字节跳动的扣子开发平台、百度文心智能体开发平台等的开发工具也已经很容易上手了。

wKgZPGdqSSuAU7HZAAJYKqWJZGY644.jpg

三是大模型应用从开发到商业化的“端到端”支持。

2024年并没有出现国民级的第三方AI应用。一方面是模型能力本身还需要提升,一些AI智能体平台充斥着大量低水平、易复制的个人智能体,对话体验、理解能力、多模态任务等的效果一般,没有太大商业价值;另一方面,是很多开发者不知道AI应用如何商业化,所以还没有投入太大精力去开发市场缺乏的产品,满足尚未解决的需求,这就需要平台加大对开发者的商业资源扶持。

归根结底,技术天花板短期内难以突破,大模型市场饱和与同质化竞争的局面就不会宣布解决。大模型要取得商业成功,前提是用户和开发者的业务能否成功,这是为什么完善的商业基础设施必不可少。

逃离内卷的堰塞湖,所有模厂2025年都必须回答的问题是:如果大模型是水和电,那么用户和开发者拧开开关,究竟能得到什么?

wKgZO2dqSSuAQueGAAHvSKOgH4s728.jpg

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30805

    浏览量

    268947
  • 大模型
    +关注

    关注

    2

    文章

    2436

    浏览量

    2666
收藏 人收藏

    评论

    相关推荐

    【「大模型启示录」阅读体验】营销领域大模型的应用

    使企业能够提前洞察市场动向,制定前瞻性的市场策略,从而在竞争占据有利地位。 通过分析广告投放的效果数据,大模型可以帮助企业优化广告内容和投放策略。这包括确定最佳的广告渠道、投放时间和目标受众,以及
    发表于 12-24 12:48

    AIGC技术在内容创作的应用

    通过深度学习、自然语言处理、图像识别等技术,实现对文本、图像、音频和视频等内容的自动生成。AIGC技术的核心优势在于其高度的自动化和智能化,能够在短时间内生成大量高质量的内容。 二、AIGC技术在内容创作的应用 文本生成 AIGC技术在文本生
    的头像 发表于 10-25 15:08 491次阅读

    国产MCU厂商,靠什么从内卷脱颖而出?

    导语在当下内卷的大环境下,航顺芯片是如何消除内卷,突破高端的?当前,全球半导体行业正经历寒冬。受经济环境疲软、消费需求减弱、库存调整等因素影响,半导体市场增速显著放缓。在这种背景下,半导体厂商间
    的头像 发表于 10-22 16:20 316次阅读
    国产MCU厂商,靠什么从<b class='flag-5'>内卷</b><b class='flag-5'>中</b>脱颖而出?

    “反内卷”的智能座舱向何处去?

    前段时间,有一个声音在汽车圈回荡:别卷了! 中国几家新能源汽车厂商,打响了“反内卷”第一枪,蔚来、吉利、小鹏甚至新入局的小米,都对“卷周榜”表示不满,认为周榜是低水平内卷,大家都在比谁的价格更低,而
    的头像 发表于 10-21 16:37 222次阅读
    “反<b class='flag-5'>内卷</b>”的智能座舱向何处去?

    如何找出住宅的电路火灾隐患?

    1.怎样找出住宅的电路火灾隐患呢 1.1电线超载  如果保险丝烧断,继电器重复跳闸,电灯发暗,或者闻到金属或塑料焦糊味,那么这是一个危险信号:要么是电线发生故障,要么是负载过大。要更换电线或增容
    的头像 发表于 10-17 09:10 242次阅读
    如何<b class='flag-5'>找出</b>住宅<b class='flag-5'>中</b>的电路火灾隐患?

    光伏行业内卷还有多久?

    至暗时刻是否已经过去?光伏行业的内卷还要持续多久?磁性元件企业又该如何破局?这篇文章通通为你解答! 当前两年如火如荼的光伏行业,利润变得比家电行业还要低的时候,光伏行业未来的出路在哪,就变成了很多光
    的头像 发表于 10-11 11:28 211次阅读

    旗帜鲜明反内卷,连接器上下游如何做到?

    “防内卷式恶性竞争”成为关注重点,连接器行业如何避免陷入内卷恶性循环?对话连接器供应链上下游,一起探寻内卷破局关键。 如果用一个字来评价2024年的汽车行业,那就是「卷」。 长安汽车董事长朱华荣说
    的头像 发表于 09-23 10:00 197次阅读
    旗帜鲜明反<b class='flag-5'>内卷</b>,连接器上下游如何做到?

    2024年含直线电机3D打印机在内出口182.9万台

    据近期统计局发布的数据显示:2024年上半年(1月-6月),国产3D打印机出口总台数为182.9万台(不含零部件),比2023年上半年出口的总台数130.4万台增长了40.3%;出口总金额为42.7
    的头像 发表于 08-05 08:15 381次阅读
    2024年含直线电机3D打印机<b class='flag-5'>在内</b>共<b class='flag-5'>出口</b>182.9万台

    深度学习模型权重

    在深度学习这一充满无限可能性的领域中,模型权重(Weights)作为其核心组成部分,扮演着至关重要的角色。它们不仅是模型学习的基石,更是模型智能的源泉。本文将从模型权重的定义、作用、优
    的头像 发表于 07-04 11:49 1231次阅读

    【大语言模型:原理与工程实践】大语言模型的评测

    推断孩子的年龄。而在演绎推理,我们关注模型从已知前提出发,通过逻辑推导得出结论的准确性和逻辑性,例如在真假陈述找出真实的陈述者。对于此类任务,我们主要关注两个评价指标:推理结果的准
    发表于 05-07 17:12

    韩国2月出口下跌,半导体出口反增39.1%

    具体到市场表现,韩方在对华贸易遭遇下跌局面,占整体出口份额的12.8%;另外,美(-5.0%)、欧(-22.8%)及越南(-12.2%)的出口也都有所下滑。
    的头像 发表于 02-22 09:24 462次阅读

    数组和链表在内的区别 数组和链表的优缺点

    数组和链表在内的区别 数组和链表的优缺点  数组和链表是常见的数据结构,用于组织和存储数据。它们在内的存储方式以及优缺点方面存在一些显著的差异。本文将详细探讨这些差异以及它们的
    的头像 发表于 02-21 11:30 1026次阅读

    SPICE的热模型介绍

    SPICE模型的热模型是指用于模拟和预测电子元件在工作时的热行为特性的模型。这些模型通常与电路仿真软件一起使用,以便在设计阶段评估和优化电
    的头像 发表于 02-06 11:28 1084次阅读
    SPICE<b class='flag-5'>中</b>的热<b class='flag-5'>模型</b>介绍

    方壳电芯价格内卷下,大圆柱电池差异化竞争能力越加凸显

    同质化竞争、价格内卷严重让锂电产业差异化竞争诉求越加强烈。
    的头像 发表于 01-25 10:20 1328次阅读

    IBIS模型如何导入到LTspice

    IBIS模型如何导入到LTspice
    发表于 01-03 06:23