0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新火种AI|2024乍到,会成为小模型的当打之年吗?

新火种 来源:新火种 作者:新火种 2024-01-10 22:27 次阅读


作者:小岩

编辑:美美

乘着ChatGPT爆火的东风,2023年成为了当之无愧的“大模型爆发之年”。跟随ChatGPT的脚步,诸多大厂和知名企业推出了自己的AI大模型。也正因此,大模型赛道的竞争变得异常激烈,烧钱的势头也变得异常凶猛。

不过,这样的趋势很可能在2024年产生变化。每个事物的发展都要经历“产生,发展,高潮,低谷”的阶段,已经在2023年大放异彩,涌现无数高光时刻的大模型很可能在2024年渐渐冷却,褪掉光环,而小模型,则有可能成为今年的破局之道。

“大模型虽然亮眼,但企业对这些技术的采用几乎没有实质性的增长”。

众所周知,在高新技术和烧钱测试的加持下,大模型产品的表现变得十分突出,整个赛道也卷的出奇。但可惜的是,这些花大力气砸出来的优秀大模型产品很难成功变现。

根据印度IT巨头Infosys的最新发现,只有6 %的欧洲公司通过生成式AI用例创造了商业价值。麦肯锡也在2023年的一份报告中得出结论,“尽管生成式AI的使用可能会刺激其他人工智能工具的采用,但我们认为,企业对这些技术的采用几乎没有实质性的增长。”

而资本市场对于大模型AI的态度也不乐观。从融资规模来看,生成式AI的投资浪潮是一次“短暂繁荣”,尽管头部以及率先抢占先机的AI公司获得了不少资本的青睐,但后续的AI公司如果想要收获资金,并不容易。根据Crunchbase数据显示,2023 年,人工智能独角兽公司的融资大幅下降,仅为 2021 年市场高峰时的25 %左右;全球最活跃的9大 VC 在AI独角兽公司的投资也是大幅下降。

究其原因,这并不难理解。潮水退去,方知谁在裸泳。投资者都是趋利避害的,自然想看到自己投资的AI公司产出尽可能多的利润。在这种情况下,针对AI的投资泡沫会越来越少,据此,AI公司试错的成本将大大提高。

大模型发展即将受阻,小模型能否顺势而为,迎来自己的井喷元年?

在这种情况下,AI模型需要朝着效率更高,成本更低的方向去发展。从这个角度去说,小模型很可能比大模型更实用,更方便。

Snorkel AI曾做过一个试验,分别用GPT-3微调和自己搭建的小模型来训练一个法律领域的垂直模型。GPT-3的微调和搭建成本是7418美元,10000推理的花费是173美元,而自己搭建的小模型成本仅为1915美元,10000次推理也只是花费了0.26美元。从正确率来看,GPT-3微调的垂直模型正确率为71.4 %,小模型则为71.3 %。

值得一提的是,GPT-3的参数量很大,是小模型的1400倍。我们当然不能因为GPT-3微调的正确率与小模型的正确率相似就妄下结论,认为“参数量没用”。不过,这或许就是“杀鸡焉用牛刀”的道理,就像《华尔街日报》提到的那句玩笑,用GPT-4总结电子邮件就像“让兰博基尼送披萨”。毕竟,在很多场景下,用户需要的并没有那么多。

目前,国内的AI领域也在面临相同的状况。

如今,国内已经发布的所谓“大模型”超过200个,“百模大战”进行的如火如荼。而处于头部的几个大模型都曾宣称自己的参数规模超千亿级别,有的甚至达到了万亿的规模。

但规模只要够大,就一定够好吗?未必。百度的李彦宏曾经说过,“100多个大模型浪费社会资源……尤其在中国算力还受限制情况下,企业应该去探索各行各业的应用结合,全新的 APP产品可能性等。”

事实上,与李彦宏持有相同观点的人并不在少数。相较于要把AI模型的规模不断做大这件事,大家更应该关注如何将模型更好的应用到实处。不是大模型做不起,而是小模型更具性价比。

做小模型的本质,其实是在做离用户更近的模型。

更重要的是,从某种层面来说,更好操作,更低成本的小模型或许更能匹配C端用户的核心诉求。

大模型看似高大上,但却存在成本高,个性化不足的问题。如果大模型可以变小,甚至直接走进移动端,将模型塞进手机智能汽车,机器人等设备,那么一定会大大提高C端用户的黏着度。特别是从创业角度来看,搭建离用户更近的模型自然也更有生存空间,因为他们离用户更近。

事实上,很多企业已经将这样的策略提上了日程。有媒体报道,早在2022年初,阿里巴巴达摩院,上海浙江大学高等研究院,以及上海人工智能实验室的联合研究团队通过蒸馏压缩和参数共享等技术手段,将3.4亿参数的M6模型压缩到了百万参数,其规模只有以大模型的三十分之一,却保留了大模型90 %以上的性能。当然,2022年的3.4亿,较今天的大模型规模来看不算太大,但这个举动无疑为“大规模瘦身”开了一个好头。

2023年初,关于AI大模型的竞争逐渐激烈,局面逐渐焦灼,最终演变成了一场声势浩大的模型竞赛。如今,潮水褪去,在耗费了大量金钱,人力,时间成本之后,愈来愈多的AI公司悟出了一个道理:如何“变大”并不是关键,关键在于要如何“既大又好”,更重要的是,当大模型进入应用环节,如何该做到“以小驭大。

如同区块链行业一样,野蛮生长之后势必会迎来监管的压力,AI也将面临同样的状况。如今,随着AI影响力的增强,相关的问题也开始凸显譬如Midjourney + Elevenlabs 生成的假新闻就引起过极大的影响。

此外,AI大模型的推进将消耗掉大量的资源。有新闻报道,到2027年,全球的AI需求可能会消耗掉66亿立方米的水资源,几乎相当于美国华盛顿州全年的取水量。AI对环境和能源可能造成的影响会对AI行业造成一定的经济压力和政治压力。到了那时,如何用更少的数据,更少的能源训练出更好用的模型,就成为了未来的重中之重。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    28860

    浏览量

    266176
  • 人工智能
    +关注

    关注

    1787

    文章

    46047

    浏览量

    234940
  • ChatGPT
    +关注

    关注

    28

    文章

    1517

    浏览量

    6904
  • 大模型
    +关注

    关注

    2

    文章

    2132

    浏览量

    1970
收藏 人收藏

    评论

    相关推荐

    博联AI模型全屋智能亮相2024中国建博会

    2024中国建博会(广州)在广交会展馆及保利世贸博览馆盛大启幕。 BroadLink博联智能携AI模型全屋智能以及AI商业照明解决方案惊喜亮相, 全方位展示
    的头像 发表于 09-12 15:46 200次阅读

    2024 TUYA全球开发者大会盛大启幕,Cube AI模型重磅首发!

    AI浪潮席卷全球的当下,把握时代脉搏,全面拥抱生成式AI成为共识。面对AI带来的无限可能,开发者们纷纷投身其中,积极探寻
    的头像 发表于 05-31 08:15 254次阅读
    <b class='flag-5'>2024</b> TUYA全球开发者大会盛大启幕,Cube <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>重磅首发!

    2024 TUYA全球开发者大会盛大启幕,Cube AI模型重磅首发!

    2024 TUYA全球开发者大会上,重磅推出AI模型AI开发工具、AI小程序开发基座等重量级产品,让
    发表于 05-30 09:13 186次阅读
    <b class='flag-5'>2024</b> TUYA全球开发者大会盛大启幕,Cube <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>重磅首发!

    云天励飞入选2024中国AI基础大模型创新企业

    5月16日,甲子光年“星辰100 2024创新企业榜颁布”,云天励飞凭借自主研发的“云天天书”大模型,入选2024中国AI基础大模型创新企业
    的头像 发表于 05-17 17:23 429次阅读
    云天励飞入选<b class='flag-5'>2024</b>中国<b class='flag-5'>AI</b>基础大<b class='flag-5'>模型</b>创新企业

    2024中国AI模型产业发展报告

    日前,人民网财经研究院、至顶科技联合发布《开启智能新时代:2024年中国AI模型产业发展报告》(以下简称《报告》),对于AI模型产业发展
    的头像 发表于 03-30 08:26 662次阅读
    <b class='flag-5'>2024</b>中国<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>产业发展报告

    防止AI模型被黑客病毒入侵控制(原创)聆思大模型AI开发套件评测4

    在设计防止AI模型被黑客病毒入侵时,需要考虑复杂的加密和解密算法以及模型的实现细节,首先需要了解模型的结构和实现细节。 以下是我使用P
    发表于 03-19 11:18

    使用CUBEAI部署tflite模型STM32F0中,模型创建失败怎么解决?

    看到CUBE_AI已经支持STM32F0系列芯片,就想拿来入门嵌入式AI。 生成的模型很小,是可以部署F0上的,但是一直无法创建成功。
    发表于 03-15 08:10

    火种AI|两会在即,合理前瞻:2024会成为中国AI的应用之年吗?

    “当之年”的AI,会是两会上最硬的那道菜。
    的头像 发表于 02-28 16:56 350次阅读

    MWC2024:高通推出全新AI Hub及前沿多模态大模型

    2024年世界移动通信大会(MWC)上,高通再次展现其技术领导力,通过发布全新的高通AI Hub和展示前沿的多模态大模型技术,推动了5G和AI技术的融合创新。
    的头像 发表于 02-26 16:59 1090次阅读

    火种AI|手机大模型开卷,但划时代的改变还没到来

    机器人、影像画面处理、通话实时翻译等多项AI功能,AI手机正式成为国内外手机厂商共同的“进化趋势”。 在此之前,1月8日和1月10日,国内手机的两场发布会,OPPO和荣耀,都非常默契地锁定了A
    的头像 发表于 02-18 14:36 355次阅读
    新<b class='flag-5'>火种</b><b class='flag-5'>AI</b>|手机大<b class='flag-5'>模型</b>开卷,但划时代的改变还没到来

    AI手机比例有较大提升 2024年将成为AI手机的元年

    2024AI手机的比例将有较大提升,将成为AI手机的元年。
    的头像 发表于 01-22 11:19 940次阅读
    <b class='flag-5'>AI</b>手机比例有较大提升 <b class='flag-5'>2024</b>年将<b class='flag-5'>成为</b><b class='flag-5'>AI</b>手机的元年

    火种AI|“赌城”上演“科技春晚”,AI硬件将在2024年大爆发

    如果说2023年是生成式AI元年,那么2024年将会是AI硬件的元年。
    的头像 发表于 01-12 18:26 777次阅读
    新<b class='flag-5'>火种</b><b class='flag-5'>AI</b>|“赌城”上演“科技春晚”,<b class='flag-5'>AI</b>硬件将在<b class='flag-5'>2024</b>年大爆发

    [AI原生应用]2024年到来?

    AI模型
    电子发烧友网官方
    发布于 :2024年01月02日 16:43:46

    AI模型怎么解决芯片过剩?

    AI模型
    电子发烧友网官方
    发布于 :2024年01月02日 15:42:05

    AI模型可以设计电路吗?

    AI模型
    电子发烧友网官方
    发布于 :2024年01月02日 15:09:29