ChatGPT→LLaMA→Apple GPT：盘点国外大模型产业发展之路-电子发烧友网

大模型是“大算力+强算法”的产物，是人工智能发展的趋势和未来。大模型助力AI实现从“手工作坊”到“工厂模式”的转变，从而使得AI从实验室走向规模化的产业应用。大模型通常基于大规模无标注数据进行训练，掌握某种特征和规则；基于大模型进行应用开发时，将大模型进行微调，或者不进行微调，就可以完成多个应用场景的任务。与此同时，大模型具有自监督学习能力，不需要或很少需要通过人工标注的数据进行训练，降低了训练成本，因而能够加快AI的产业化进程，降低AI应用的门槛。通过不断迭代，大模型能够具有更强的通用性以及更高的智能程度，从而使得AI更广泛地赋能各行业应用。

ChatGPT掀起通用人工智能浪潮

2019年，OpenAI推出参数量高达15亿的通用语言模型GPT-2，能够生成连贯的文本段落，实现初步的阅读理解、机器翻译等。2020年，OpenAI推出超大规模语言训练模型GPT-3，参数量达到了1750亿，用两年左右的时间实现了模型规模从亿级到千亿级的突破，并能够实现作诗、聊天、生成代码等功能。2021年1月，谷歌推出的Switch Transformer模型以高达1.6万亿的参数量成为史上首个万亿级语言模型。同年12月，谷歌还推出了1.2万亿参数量的通用稀疏语言模型GLaM。可以看到，大型语言模型的参数量保持着指数级增长的势头。2022年，OpenAI推出的ChatGPT是由比GPT-3更强大的GPT-3.5系列模型提供支持，并且这些模型使用微软AzureAI超级计算基础设施上的文本和代码数据进行训练。

2022年，ChatGPT突然走红，这是人工智能大规模展示通用应用场景的开始。在此基础上，生成式人工智能（AIGC）成为了推动行业领域发展的重要力量。AIGC既是内容的分类方式和生产方式，又是用于内容自动生成的一类技术集合，AIGC带动了LLM、GPT等大模型的发展应用，为人工智能产业带来了新的变革机会。

大模型与AIGC为人工智能领域带来了新变化。从当前大模型的发展趋势看，大模型企业更倾向于搭建平台，对传统企业进行赋能。具体而言，大模型企业凭借对组织型用户“痛点”的了解，搭建大模型平台，而组织型用户只需加入自己独有的场景数据，即可快速生成解决自身问题的“专属模型”。不过，这种提供定制解决方案的模式也面临开源模式带来的挑战。

LLaMA2开源改变大模型游戏规则

ChatGPT发布后，Meta紧跟着推出了类GPT大语言模型LLaMA。模型公布后不久，LLaMA因为源码泄露引来了大量开发者的关注，在ChatGPT热度下降的情况下，LLaMA成为产业关注的“新宠”。

2023年前5个月，ChatGPT全球访问量增长幅度明显下降，6月的访问量更是环比下滑9.7%，为其自推出以来首次大幅度下滑。7月，Meta发布首个开源人工智能模型LLaMA的商业版本LLaMA2，该商用大模型可为企业提供OpenAI和谷歌的替代方案，该模型也因此被视为“最强平替”。需要特别说明的是，LLaMA2运行在Windows操作系统之上，整合了Azure云，原本与OpenAI长期深入合作的微软已成为LLaMA2的“首选合作伙伴”。

Meta针对LLaMA2的开源模式做了如下表述：“我们相信，开源的方法是当今人工智能模型发展的正确途径，尤其是在技术进步日新月异的生成式人工智能领域。”通过开源的方式吸引足够的参与者，从而搭建一套完善的生态系统，是Meta这类互联网企业的一贯作风，但对于已投入大量成本而期望采用定制化解决方案的玩家而言，却不是什么好消息。

Meta的操作让人联想到Facebook的开源计算项目OCP，该项目被用于改变服务器硬件的制造方式，以更好地适应互联网时代。OCP除了对应的机架规范Open Rack，还包括服务器、网络、存储，乃至数据中心的设计。OCP被视为Facebook最为重要的科技项目之一，旨在把“开源”概念引入数据中心硬件，为数据中心提供更快、更便宜、用材更少的硬件。

OCP的开放性体现在免费提供设计，任何企业都可以使用它，并对其进行调整，这意味着，惠普、戴尔和思科这类传统硬件供应商将不再控制产品设计，取而代之是由用户自己控制。这给思科等硬件制造市场的老玩家带来了很大威胁，因为OCP很有可能为企业提供更便宜、更灵活的替代方案，从而淘汰传统的昂贵方案。微软、苹果等科技巨头都加入了OCP阵营，开始把OCP的一些概念整合到自身的数据中心，形成新的生态。Facebook也通过构建在OCP基础上的各种技术，大大减少了对“思科们”的依赖。

LLaMA2的开源模式可能会影响OpenAI等公司在生成式人工智能软件市场中取得的早期主导地位。因为Meta意在借助LLaMA2构建人工智能开源生态系统，快速扩大其市场规模并建立口碑，同时阻碍竞争对手从其专有技术中赚取收入。

Apple GPT入局，前路未知

在Meta、微软、OpenAI等公司各出奇招的同时，以封闭系统作为竞争优势的Apple等公司也在借助Siri等人机交互触点的优势向上游拓展。近期，业内传出Apple秘密研发Apple GPT的消息。

据了解，Apple GPT是一款基于苹果自研Ajax框架开发的人工智能工具，这一产品已在苹果内部小范围内投入使用。与其他解决方案不同的是，目前Apple尚未决定Apple GPT未来的开发方向，甚至严格规定了Apple GPT的使用场景，禁止将其输出用于开发面向用户的功能。这体现了不同企业对大模型市场发展的不同理解和判断，同时也体现了“利用大模型做未来物联网入口的可能性和交互能力的升级”这种定位和发展方向的选择。

大模型时代的人工智能伦理风险

开源大模型将加速人工智能市场的应用拓展，但与此同时，人工智能哲学尤其是科技伦理方面的争议甚嚣尘上，大模型的可靠性、安全性、知识产权等也成为了产业亟待解决的新课题。大模型目前还面临较大的挑战，包括大模型“幻觉”、“一本正经地胡说八道”、政企私有数据的保密性要求、大模型存在封闭性等，同时信息垄断、知识产权等问题也不容忽视。

知识可靠性及信息误导等问题

ChatGPT不能保证回答问题的可靠性和准确性，对于“如果相同的问题在不同时间问你有不同的结果，我怎么知道哪一个比较可信，或者哪一个更为接近真相”这个问题时，ChatGPT给出了如下答复：“作为一种人工智能系统，我是基于一组固定的算法和数据运行的，并且在回答问题时会遵循程序化的逻辑。因此，如果对同一个问题多次询问，答案应该是一致的，除非模型的数据或算法发生了更改。不过，即使我的回答是一致的，也不能完全保证答案的正确性和可靠性，因为我的训练数据和算法可能存在偏见或错误，我并不能独立判断我回答的问题是否符合真实情况。”

ChatGPT要学习大量的文本数据，并以特定的算法处理数据，因此可通过提供误导性训练数据或者改变算法，操控处理结果。也就是说，我们不能准确理解作为“黑盒”的数据处理模型，以及信任ChatGPT采用的训练数据集的“权威性”，即便在一个我们熟悉的领域，细微的差别也可能导致巨大的结论偏差。

从知识可靠性的角度看，知识应用的场景需要非常谨慎，尤其是在学术研究领域，必须严格限制ChatGPT信息的引用。

信息垄断问题

如果模型的使用和控制都是不透明的，就有可能出现信息垄断。信息垄断是指一个或一些组织及个人控制着信息的生产、流通和使用，从而有效地排除竞争。因此，如果行业不采用透明公开的方式去评估和监督使用信息，那么就可能存在信息垄断的风险。

知识产权问题

ChatGPT由OpenAI训练，数据集是从互联网上收集来的大量文本数据，包含新闻报道、维基百科条目、小说、博客、论坛帖子、技术文档、社交媒体内容等信息，这些数据可能存在著作权侵权的风险。

具体而言，OpenAI尝试遵循合法、道德的原则来获取数据，但并不能保证所有数据的著作权拥有者都同意OpenAI将其数据用来训练语言模型。风险在于数据的处理结果是构建在未经授权的第三方经验之上，而通过这些经验获得的价值并没有与第三方共享，或者说他们甚至都没有意识到自己的数据被使用。在现实世界中肖像权被侵犯是比较明显的，在数字世界中经过多重加工以后，这样的侵权行为就不是那么明显。

在现实世界中可能会出现这样的情况：ChatGPT的回答可能无意之间引用了作者声明需要分享商业收益的内容，在不知情的情况下侵犯了作者的知识产权。此外，经过复杂的模型处理之后，文本的所有者可能很难知道ChatGPT对他的资产进行了处理，也就是说，尽管理论上文本的所有者可以去维权，但实践成本会非常高。

针对这个问题，ChatGPT是这样回应的：“确实存在难以识别使用者行为的问题。不过我是一个由OpenAI制作并管理的计算机程序，并且OpenAI是一个认真对待知识产权和隐私的公司，他们遵循相关法律法规，努力确保这些法律法规在用户使用我的过程中得到遵循。当然，如果您发现有任何违反知识产权的情况，建议您及时联系OpenAI，以帮助他们解决问题。”

能否用于解决具有创造性的问题

这个问题看起来更像是一个人工智能的哲学问题。科学发展的传统看法是：科学知识是不断增加的，发展是一个直线的、知识积累的过程。这是为大多数人所接受的科学发展观，也是ChatGPT体现出来的知识“归纳”，其文字编码的概率让结果体现出这样的特征。波普证伪主义强调的不是知识的积累，而是科学理论的更替，旧理论不断被推翻，新理论取而代之。

大模型带来了强大的智能，能够推动人工智能向更高级的智能应用迈进，例如AIGC、更智能的对话客服等。GPT-3等大模型在新闻文本生成、商业文本分析、法律文本分析等领域具有较高的产业应用价值。除问答以外，ChatGPT能够完成编程、写稿等众多超出人们想象的任务。谷歌公司曾表示：“如果ChatGPT参加谷歌的面试，理论上会得到入门级程序员的聘任。因此，更为关键的是我们怎么理解‘创造性’这个词的含义。”

结语

无论如何，大模型仅仅是生成式人工智能大规模商用的前奏，许多领域的企业都在尝试将大模型能力与自身的优势、定位和战略发展方向结合起来。无论是从打造难以被模仿的技术优势、大模型能力与复杂场景结合构建更强的解决方案能力、借助开源模式降低大模型使用门槛形成规模化垄断，还是借助传统的触点优势进一步提升终端用户的体验，市场上不同的玩家都在根据自身的理解尝试定义大模型的未来。而在通向未来的道路上，大模型将比其他领域面临更多的伦理、法律、道德方面的难题，这也是大模型企业在打造市场竞争力的同时，面临的新课题。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1791

文章
47259

浏览量
238424
ChatGPT

ChatGPT

+关注

关注
29

文章
1560

浏览量
7641
大模型

大模型

+关注

关注
2

文章
2442

浏览量
2692

原文标题：ChatGPT→LLaMA→Apple GPT：盘点国外大模型产业发展之路

文章出处：【微信号：txshj123，微信公众号：通信世界】欢迎添加关注！文章转载请注明出处。

Meta重磅发布Llama 3.3 70B：开源AI模型的新里程碑

新的高度。一，技术突破：开源智能的新高度 Llama 3.3 70B 模型的发布，标志着开源AI模型在智能水平上的一大飞跃。它不仅达到了之前只有 Llama 3.1 405B

发表于 12-18 16:46 •116次阅读

Meta重磅发布<b class='flag-5'>Llama</b> 3.3 70B：开源AI<b class='flag-5'>模型</b>的新里程碑

解锁 GPT-4o！2024 ChatGPT Plus 代升级全攻略（附国内支付方法）

ChatGPT Plus 每月 20 美元，OpenAI 承诺 Plus 用户享有更快的响应速度、优先使用新功能及最新模型，包括强大的 GPT-4o。本文将分享 2024 年 ChatGPT

发表于 10-29 18:17 •834次阅读

Llama 3 模型与其他AI工具对比

Llama 3模型与其他AI工具的对比可以从多个维度进行，包括但不限于技术架构、性能表现、应用场景、定制化能力、开源与成本等方面。以下是对Llama 3模型与其他一些主流AI工具的对比

发表于 10-27 14:37 •385次阅读

Llama 3 与 GPT-4 比较

随着人工智能技术的飞速发展，我们见证了一代又一代的AI模型不断突破界限，为各行各业带来革命性的变化。在这场技术竞赛中，Llama 3和GPT-4作为两个备受瞩目的

发表于 10-27 14:17 •344次阅读

Llama 3 语言模型应用

在人工智能领域，语言模型的发展一直是研究的热点。随着技术的不断进步，我们见证了从简单的关键词匹配到复杂的上下文理解的转变。一、Llama 3 语言模型的核心功能上下文理解：

发表于 10-27 14:15 •279次阅读

如何使用 ChatGPT 进行内容创作

到ChatGPT平台。选择模型： ChatGPT目前支持GPT3.5和GPT4两个模型。根据

发表于 10-25 16:08 •444次阅读

亚马逊云科技上线Meta Llama 3.2模型

亚马逊云科技近日宣布，Meta公司的新一代模型Llama 3.2已在其平台上正式上线。该模型包括Meta首款多模态模型，现已在Amazon Bedrock和Amazon SageMak

发表于 10-11 18:08 •459次阅读

llm模型和chatGPT的区别

，有许多不同的LLM模型，如BERT、GPT、T5等。 ChatGPT是一种基于GPT（Generative Pre-trained Transformer）

发表于 07-09 09:55 •1066次阅读

国内直联使用ChatGPT 4.0 API Key使用和多模态GPT4o API调用开发教程！

1. 前言 ChatGPT-4o API 是 OpenAI 提供的强大工具，可用于自然语言处理和多模态任务。在国内直联使用这些服务需要一些配置和技巧。本文将详细介绍GPT-4o模型以及如何获取

发表于 06-08 00:33 •4955次阅读

名单公布！【书籍评测活动NO.34】大语言模型应用指南：以ChatGPT为起点，从入门到精通的AI实践教程

了备受瞩目的ChatGPT。在接下来的不到一年的时间里，大语言模型的生态系统迅速壮大并蓬勃发展。大语言模型的生态系统可以分为模型层、框架

发表于 06-03 11:39

ChatGPT免费用户可试驾自定义GPT模型及分析图表等功能

据悉，自今年 5 月 30 日起，免费版 ChatGPT 的使用者可使用自定义 GPT 模型、图表分析等GPT-4o新增功能。尽管 OpenAI 早前承诺

发表于 05-30 11:20 •614次阅读

OpenAI 深夜抛出王炸 “ChatGPT- 4o”， “她” 来了

当地时间5月13日OpenAI推出ChatGPT-4o，代表了人工智能向前迈出的一大步。在GPT-4turbo的强大基础上，这种迭代拥有显著的改进。在发布会的演示中，OpenAI展示该模型的高级

发表于 05-27 15:43

OpenAI推出面向所有用户的AI模型GPT-4o

在周一的直播盛会上，OpenAI揭开了其最新的人工智能模型GPT-4o的神秘面纱。这款新模型旨在为其著名的聊天机器人ChatGPT提供更强大、更经济的支持。

发表于 05-15 09:23 •402次阅读

苹果拟推出自研大语言模型Ajax，以优化iOS 18，但排除ChatGPT等选项

早在2023年7月，Ajax模型就曾引发关注。该模型采用Google的Jax机器学习框架，运行在谷歌Cloud平台上，被部分工程师称为“Apple GPT”，与OpenAI的

发表于 05-06 15:25 •402次阅读

Meta推出最强开源模型Llama 3 要挑战GPT

Meta推出最强开源模型Llama 3 要挑战GPT Facebook母公司Meta Platforms（META.US）推出了开源AI大模型“Ll

发表于 04-19 17:00 •838次阅读

搜索历史

ChatGPT→LLaMA→Apple GPT：盘点国外大模型产业发展之路

评论

Meta重磅发布Llama 3.3 70B：开源AI模型的新里程碑

解锁 GPT-4o！2024 ChatGPT Plus 代升级全攻略（附国内支付方法）

Llama 3 模型与其他AI工具对比

Llama 3 与 GPT-4 比较

Llama 3 语言模型应用

如何使用 ChatGPT 进行内容创作

亚马逊云科技上线Meta Llama 3.2模型

llm模型和chatGPT的区别

国内直联使用ChatGPT 4.0 API Key使用和多模态GPT4o API调用开发教程！

名单公布！【书籍评测活动NO.34】大语言模型应用指南：以ChatGPT为起点，从入门到精通的AI实践教程

ChatGPT免费用户可试驾自定义GPT模型及分析图表等功能

OpenAI 深夜抛出王炸 “ChatGPT- 4o”， “她” 来了

OpenAI推出面向所有用户的AI模型GPT-4o

苹果拟推出自研大语言模型Ajax，以优化iOS 18，但排除ChatGPT等选项

Meta推出最强开源模型Llama 3 要挑战GPT