ChatGPT大模型，引领海内外巨头竞品发布-电子发烧友网

大模型运行成本高昂，准入壁垒较高。大模型对于训练时间和参数量都有高要求，以 OpenAICEO Altman 在推特上回复马斯克的留言可知，ChatGPT 平均一次聊天成本为几美分。根据Similar Web 数据，2023 年１月 27 日至 2 月 3 日 ChatGPT 日活跃用户达 2500 万人。中性假设下，以平均单人单日对话 7 次，每次 3 美分成本进行测算，对应一年支出对话成本约为19.2 亿美元。根据英伟达官网，A100 作为 DGX A100 系统的一部分进行销售，该系统搭载 8个 A100 GPU，一个由 5 台 DGX A100 系统组成的机架可替代一个包括 AI 训练和推理基础设施的数据中心，且功耗仅为其 1/20，成本为其 1/10，系统售价 19.9 万美元。因此，在中性假设条件下，考虑到服务器约占数据中心成本的 70%（中商产业研究院），则 ChatGPT 运营一年将需要 6741 个 DGX A100 系统用于支撑访问量。

ChatGPT带动大模型竞品发布，海内外科技巨头先后加码AI布局。

1）谷歌向AI公司Anthropic投资近 4 亿美元，后者正在测试生成式 AI 工具 Claude，且谷歌也推出对标 ChatGPT 的聊天机器人 Bard。

2）微软以 100 亿美元投资 ChatGPT 的开发商 OpenAI，并获得其 49%股权。2023年 2 月，微软发布基于 ChatGPT 的 new Bing。

3）亚马逊云服务 AWS 宣布与 AI 公司 HuggingFace 开展合作，Hugging Face 将在 AWS 上开发针对 ChatGPT 的开源竞品，构建开源语言模型的下个版本 Bloom。

4）阿里达摩院正研发类 ChatGPT 的对话机器人，目前已处于内测阶段。

5）百度开发类 ChatGPT 项目“文心一言”（ERINE Bot）。

6）京东推出产业版 ChatJD。

基于昆仑芯+飞桨+文心大模型 AI 底座，百度推出“文心一言”拉开国产生成式 AI 序幕。2023年 3 月 16 日，百度正式推出国内首款生成式 AI 产品“文心一言”，可支持文学创作、文案创作、数理推算、多模态生成等功能，目前已有多家厂商宣布接入。“文心一言”基于全栈自研的 AI 基础设施进行学习和训练：

 昆仑芯 2 代 AI 芯片：“文心一言”的芯片层核心能力，采用自研 XPU-R 架构，通用性和性能显著提升；256 TOPS@INT8 和 128 TFLOPS@FP16 的算力水平，较一代提升 2-3 倍，保障“文心一言”算力需求；采用 7nm 先进工艺，GDDR6 高速显存，支持虚拟化，芯片间互联和视频编解码等功能。

 飞桨深度学习平台：“文心一言”的框架层核心能力，系业内首个动静统一的框架、首个通用异构参数服务器架构，支持端边云多硬件和多操作系统，为文心大模型提供有效、快捷、完整的训练框架。

 文心知识增强大模型：“文心一言”的模型层核心能力，该产品主要采用 ERNIE 系列文心NLP 模型，拥有千亿参数级别的 ERNIE 3.0 Zeus 为该系列最新模型，进一步提升了模型对于不同下游任务的建模能力，大大拓宽了“文心一言”的应用场景。

以 GPT-3 为例测算：大算力需求驱动 AI 硬件市场空间提升

GPT-3（Generative Pre-trained Transformer 是 GPT-3.5 的上一代语言模型，目前一般所说的 GPT-3 即为拥有 1750 亿参数的最大 GPT-3 模型，OpenAI 在公开发表的论文《Language Models are Few-Shot Learners》中对 GPT-3 模型进行了详细分析。对于以 ChatGPT 为例的大模型算力需求，根据测算，我们预计用于高端 GPGPU 显卡的训练及推理部分市场空间合计约 145.32 亿元，其中训练市场规模为 27.84 亿元，推理市场规模为 117.48 亿元。

英伟达引领硬件端产品升级，国产 GPU 静待花开

大 GPU 优势在于通过并行计算实现大量重复性计算。GPGPU（General Purpose GPU）即通用GPU，能够帮助 CPU 进行非图形相关程序的运算。在类似的价格和功率范围内，GPU 能提供比CPU 高得多的指令吞吐量和内存带宽。

GPT-4 模型算力需求扩增，架构升级降本增效未来可期

根据 OpenAI 官网显示，目前 GPT-4 每 4 小时只能处理 100 条消息，且并没有开放图片识别功能。大模型升级带来的运算需求逐渐加码，且可推测目前算力已处于供不应求状态。

多模态拓展，图片识别算力需求升级十倍以上。关于从图片到 token 的转换方式，OpenAI 未公布 GPT-4 的模型参数,假设 GPT-4 处理图片视觉任务使用 VisionTransformer 模型（ViT），则输入图片尺寸必须为 224×224（ViT-B/16 版本）。根据 2021 年 ICLR 论文，模型原理大致为把一张图片分成 nxn 个 Patch，每一个 Patch 作为一个 Token。即把一张 224×224×3 的图片，切分为 16×16 大小的 Patch，每个 Patch 是三通道小图片，得到 16×16×3=768 个 token并作为向量输入。相较之下，根据前文 GPT-3 部分假设，假设每个文字问题 50-100 词，即67-133token。我们可以粗略推论，图像识别的所需算力是文字推理部分所需算力的十倍以上级别。

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI芯片

AI芯片

+关注

关注
17

文章
1889

浏览量
35089
聊天机器人

聊天机器人

+关注

关注
0

文章
339

浏览量
12330
ChatGPT

ChatGPT

+关注

关注
29

文章
1563

浏览量
7796

原文标题：ChatGPT大模型，引领海内外巨头竞品发布

文章出处：【微信号：AI_Architect，微信公众号：智能计算芯世界】欢迎添加关注！文章转载请注明出处。

OpenAI发布满血版ChatGPT Pro

科技巨头OpenAI近期宣布了一项重大更新，正式推出了其备受期待的“满血版”ChatGPT Pro。这一新版本基于全新的推理模型o1，旨在为用户提供更为强大的处理能力和更高质量的回答。据了解

发表于 12-06 11:10 •376次阅读

百亿液冷的星辰大海，海内外同频共振

【AI 需求激增推动液冷技术发展】大模型和生成式 AI 的发展对算力、算法平台和数据管理提出了全新要求，传统以 CPU 为中心的云计算基础设施已难以满足日益增长的交互需求。为了满足 AI 模型

发表于 11-28 14:17 •268次阅读

海内外PK，线上最畅销的监控产品是哪些？

消费类安防市场成熟，国内外品牌竞争加剧。国内厂商陷入价格战，海外市场看重实用性、价格。小米等品牌主导国内市场，海外依赖Ring等头部品牌，中国品牌在北美等市场渗透加速，智能喂鸟器等成新爆款。

发表于 11-05 09:25 •322次阅读

<b class='flag-5'>海内外</b>PK，线上最畅销的监控产品是哪些？

格科微5000万像素图像传感器量产出货

近日，格科微发布公告称，公司自主研发的5000万像素图像传感器产品已实现量产出货，并成功进入海内外中高端品牌手机后主摄市场。

发表于 10-14 17:08 •562次阅读

云知声山海大模型多项能力全球领跑

国内人工智能权威机构清华大学基础模型研究中心发布SuperBench九月综合榜单。本次评测选取海内外24个具有代表性的大模型，结果显示，山海大模型

发表于 10-12 14:30 •431次阅读

跨越万里 | 是什么吸引众多海内外客户来访有行鲨鱼？

八月夏末，九月秋初，有行鲨鱼凭借优越的产品性能、创新的研发理念以及卓越的市场表现，吸引了众多海内外客户纷纷来访考察。在来访过程中，公司副总经理张亚杰先生热情地向客户展示了有行鲨鱼在粘接材料领域的智能化生产及精细化管理模式，并深入介绍了如何通过科研创新能力实施差异化战略，以推动企业的持续创新与发展。

发表于 09-11 16:47 •272次阅读

大模型LLM与ChatGPT的技术原理

在人工智能领域，大模型（Large Language Model, LLM）和ChatGPT等自然语言处理技术（Natural Language Processing, NLP）正逐步改变着人类

发表于 07-10 10:38 •893次阅读

llm模型和chatGPT的区别

，有许多不同的LLM模型，如BERT、GPT、T5等。 ChatGPT是一种基于GPT（Generative Pre-trained Transformer）模型的聊天机器人。GPT模型

发表于 07-09 09:55 •1135次阅读

名单公布！【书籍评测活动NO.34】大语言模型应用指南：以ChatGPT为起点，从入门到精通的AI实践教程

联系，视为放弃本次试用评测资格！ 2018 年，OpenAI 发布了首个大语言模型——GPT，这标志着大语言模型革命的开始。这场革命在 2022 年 11 月迎来了一个重要的时刻——OpenAI

发表于 06-03 11:39

OpenAI 深夜抛出王炸 “ChatGPT- 4o”， “她” 来了

当地时间5月13日OpenAI推出ChatGPT-4o，代表了人工智能向前迈出的一大步。在GPT-4turbo的强大基础上，这种迭代拥有显著的改进。在发布会的演示中，OpenAI展示该模型的高级

发表于 05-27 15:43

苹果拟推出自研大语言模型Ajax，以优化iOS 18，但排除ChatGPT等选项

早在2023年7月，Ajax模型就曾引发关注。该模型采用Google的Jax机器学习框架，运行在谷歌Cloud平台上，被部分工程师称为“Apple GPT”，与OpenAI的ChatGPT、微软的Bing以及谷歌的Bard等大语

发表于 05-06 15:25 •410次阅读

KIMI与海内外主流模型对比及应用方向

从目前来看，KIMI的参数量还能够增长数倍，这对发展来说是必要的。尽管存在一些稀疏化技术，但大模型训练对算力的需求仍然在不断增加。我们之前也做过10万亿参数的模型，并证明了大参数模型对训练算力是一个重要的因素。

发表于 03-26 11:20 •1112次阅读

谷歌发布轻量级开源人工智能模型Gemma

谷歌近日宣布推出开源人工智能（AI）模型系列Gemma，旨在为开发人员和研究人员提供一个负责任的AI构建平台。这一举措标志着自2022年OpenAI的ChatGPT引领AI聊天机器人热潮后，谷歌首次

发表于 02-23 11:38 •892次阅读

sora模型发布 sora模型对现实产生的影响有多大

。 Sora发布后，OpenAI的估值迅速上涨(有望超过800亿美元，2023年ChatGPT发布不久时其估值约为290亿美元)，且文生视频大模型将会大幅推动人工智能基础设施的需求，英

发表于 02-22 17:05 •1331次阅读

【国产FPGA+OMAPL138开发板体验】（原创）6.FPGA连接ChatGPT 4

方面。而且，由于ChatGPT 4是一个大型的语言模型。通常，FPGA会用于处理一些底层的数据流或执行特定的硬件加速任务，而ChatGPT 4这样的模型则会在云端或高性能服务器上运行。

发表于 02-14 21:58

搜索历史

ChatGPT大模型，引领海内外巨头竞品发布

评论

OpenAI发布满血版ChatGPT Pro

百亿液冷的星辰大海，海内外同频共振

海内外PK，线上最畅销的监控产品是哪些？

格科微5000万像素图像传感器量产出货

云知声山海大模型多项能力全球领跑

跨越万里 | 是什么吸引众多海内外客户来访有行鲨鱼？

大模型LLM与ChatGPT的技术原理

llm模型和chatGPT的区别

名单公布！【书籍评测活动NO.34】大语言模型应用指南：以ChatGPT为起点，从入门到精通的AI实践教程

OpenAI 深夜抛出王炸 “ChatGPT- 4o”， “她” 来了

苹果拟推出自研大语言模型Ajax，以优化iOS 18，但排除ChatGPT等选项

KIMI与海内外主流模型对比及应用方向

谷歌发布轻量级开源人工智能模型Gemma

sora模型发布 sora模型对现实产生的影响有多大

【国产FPGA+OMAPL138开发板体验】（原创）6.FPGA连接ChatGPT 4