新火种AI|算力不足，小模型成AI模型发展下个方向？-电子发烧友网

作者：一号

编辑：美美

大模型不是AI的唯一出路，把模型做小也是本事。

这段时间，AI模型界是真的热闹，新的模型不断涌现，不管是开源还是闭源，都在刷新成绩。就在前几天，Meta就上演了一出“重夺开源铁王座”的好戏。发布了Llama 3 8B和70B两个版本，在多项指标上都超越了此前开源的Grok-1和DBRX，成为了新的开源大模型王者。

并且Meta还透露，之后还将推出400B版本的Llama 3，它的测试成绩可是在很多方面上都追上了OpenAI闭源的GPT-4，让很多人都直呼，开源版的GPT-4就要来了。尽管在参数量上来看，相比Llama 2，Llama 3并没有特别大的提升，但是在某些表现上，Llama 3最小的8B版本都比Llama 2 70B要好。可见，模型性能的提升，并非只有堆参数这一种做法。

Llama 3重回开源之王

当地时间4月18日，“真·OpenAI”——Meta跑出了目前最强的开源大模型Llama 3。本次Meta共发布了两款开源的Llama 3 8B和Llama 3 70B模型。根据Meta的说法，这两个版本的Llama 3是目前同体量下，性能最好的开源模型。并且在某些数据集上，Llama 3 8B的性能比Llama 2 70B还要强，要知道，这两者的参数可是相差了一个数量级。

能够做到这点，可能是因为Llama 3的训练效率要高3倍，它基于超过15T token训练，这比Llama 2数据集的7倍还多。在MMLU、ARC、DROP等基准测试中，Llama 3 8B在九项测试中领先于同行，Llama 3 70B也同样击败了Gemini 1.5 Pro和Claude 3 Sonnet。

尽管在参数量上并没有特别大的提升，但毫无疑问，Llama 3的性能已经得到了很大的进步，可以说是用相近的参数量获得了更好的性能，这可能是在算力资源短期内无法满足更大规模运算的情况下所作出的选择，但这体现了AI模型的研发并非只有堆砌参数这一条“大力出奇迹”的道路。

把大模型做小正成业内共识

实际上，在Llama 3之间的两位开源王者，Grok-1和DBRX也致力于把模型做小。和以往的大模型，使用一个模型解决一切问题的方式不同，Grok-1和DBRX都采用了MoE架构（专家模型架构），在面对不同问题的时候，调用不同的小模型来解决，实现在节省算力的情况下，保证回答的质量。

而微软也在Llama 3发布后没几天，就出手截胡，展示了Phi-3系列小模型的技术报告。在这份报告中，仅3.8B参数的Phi-3-mini在多项基准测试中都超过了Llama 3 8B，并且为了方便开源社区使用，还特意把它设计成了与Llama系列兼容的结构。更夸张的是，微软的这个模型，在手机上也能直接跑，经4bit量化后的phi-3-mini在iPhone 14 pro和iPhone 15使用的苹果A16芯片上能够跑到每秒12 token，这也就意味着，现在手机上能本地运行的最佳开源模型，已经做到了ChatGPT水平。

而除了mini杯外，微软也一并发布了小杯和中杯，7B参数的Phi-3-small和14B参数的Phi-3-medium。在技术报告中，微软也说了，去年研究团队就发现，单纯堆砌参数量并非提升模型性能的唯一路径，反而是精心设计训练的数据，尤其是利用大模型本身去生成合成数据，并配合严格过滤的高质量数据，能够让中小模型的能力大幅跃升，所以他们也说，Textbooks are all you need，教科书级别的高质量数据才是重要的。

AI模型发展正着力于摆脱限制

自英伟达乘着AI的东风，成为行业内说一不二，当之无愧的“卖铲子的人”，各家AI公司都将英伟达的GPU视为“硬通货”，以致于谁囤有更多的英伟达的GPU，谁的AI实力就强。但英伟达的GPU的交付并未能始终跟上市场的需求。

因此，很多AI公司开始另谋出路，要么找其他的GPU生产商，要么决定自己研发AI芯片。即使你囤够了英伟达的GPU，也还有其他限制，OpenAI在前段时间就被爆出，因为训练GPT-6，差点把微软的电网搞瘫痪。马斯克也曾说过，当前限制AI发展的主要因素是算力资源，但在未来，电力会成为限制AI发展的另一阻碍。

显然，如果持续“大力出奇迹”，通过堆砌参数量来实现AI性能的提升，那么以上这些问题迟早会遇到，但是如果把大模型做小，使用较小的参数量，实现同样或者更好的性能，那么将可以显著减少对算力资源的需求，进而减少对电力资源的消耗，从而让AI在有限资源的情况下，得到更好的发展。

因此，接下来，谁能在将模型做小的同时，还能实现性能的增长，也是实力的体现。

审核编辑黄宇

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
30665

浏览量
268832
算力

算力

+关注

关注
1

文章
960

浏览量
14786

企业AI算力租赁是什么

企业AI算力租赁是指企业通过互联网向专业的算力提供商租用所需的计算资源，以满足其AI应用的需求。

发表于 11-14 09:30 •409次阅读

AI时代算力的重要性及现状:平衡发展与优化配置的挑战

在AI时代，算力扮演着至关重要的角色。如果说数据是AI大模型的“燃料”，那么算

发表于 11-04 11:45 •403次阅读

AI大模型的最新研究进展

。例如，在医疗领域，生成式AI可以帮助医生生成诊断报告、治疗方案等；在教育领域，AI大模型可以生成个性化的学习资源和建议。多模态融合与交互： AI大

发表于 10-23 15:19 •395次阅读

未来AI大模型的发展趋势

上得到了显著提升。未来，算法和架构的进一步优化将推动AI大模型在性能上实现新的突破。多头自注意力机制、前馈神经网络等关键技术的改进，将增强模型的表达能力和泛化能力。多模态融合：

发表于 10-23 15:06 •571次阅读

大模型时代的算力需求

现在AI已进入大模型时代，各企业都争相部署大模型，但如何保证大模型的算力，以及相关的稳定性和性能

发表于 08-20 09:04

AI大模型的发展历程和应用前景

随着人工智能技术的飞速发展，AI大模型逐渐成为研究与应用领域的热点。AI大模型，顾名思义，是指具有巨大参数量的深度学习

发表于 07-03 18:20 •1152次阅读

STM CUBE AI错误导入onnx模型报错的原因？

使用cube-AI分析模型时报错，该模型是pytorch的cnn转化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.

发表于 05-27 07:15

防止AI大模型被黑客病毒入侵控制（原创）聆思大模型AI开发套件评测4

神经网络的电路实现 // 比如说我们已经有一台神奇的AI算力黑科技在默默工作... endmodule // 我们召唤出这个神秘的AI模型

发表于 03-19 11:18

使用cube-AI分析模型时报错的原因有哪些？

使用cube-AI分析模型时报错，该模型是pytorch的cnn转化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.

发表于 03-14 07:09

数据语料库、算法框架和算力芯片在AI大模型中的作用和影响

数据语料库、算法框架和算力芯片的确是影响AI大模型发展的三大重要因素。

发表于 03-01 09:42 •1058次阅读

AI大模型可以取代大学教育吗？

AI大模型

电子发烧友网官方
发布于 :2024年01月02日 16:27:52

AI大模型怎么解决芯片过剩?

AI大模型

电子发烧友网官方
发布于 :2024年01月02日 15:42:05

AI大模型会不会取代电子工程师?

AI大模型

电子发烧友网官方
发布于 :2024年01月02日 15:11:43

AI大模型可以设计电路吗?

AI大模型

电子发烧友网官方
发布于 :2024年01月02日 15:09:29

AGI时代的奠基石：Agent+算力+大模型是构建AI未来的三驾马车吗？

AI Agent的训练离不开算力，服务器作为一个强大的计算中心，为AI Agent提供算力基础，

发表于 12-21 13:34 •1173次阅读

搜索历史

新火种AI|算力不足，小模型成AI模型发展下个方向？

评论

企业AI算力租赁是什么

AI时代算力的重要性及现状:平衡发展与优化配置的挑战

AI大模型的最新研究进展

未来AI大模型的发展趋势

大模型时代的算力需求

AI大模型的发展历程和应用前景

STM CUBE AI错误导入onnx模型报错的原因？

防止AI大模型被黑客病毒入侵控制（原创）聆思大模型AI开发套件评测4

使用cube-AI分析模型时报错的原因有哪些？

数据语料库、算法框架和算力芯片在AI大模型中的作用和影响

AI大模型可以取代大学教育吗？

AI大模型怎么解决芯片过剩?

AI大模型会不会取代电子工程师?

AI大模型可以设计电路吗?

AGI时代的奠基石：Agent+算力+大模型是构建AI未来的三驾马车吗？