0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ChatGPT大模型,引领海内外巨头竞品发布

智能计算芯世界 来源:智能计算芯世界 2023-04-17 10:28 次阅读

9107941c-dcae-11ed-bfe3-dac502259ad0.png

大模型运行成本高昂,准入壁垒较高。大模型对于训练时间和参数量都有高要求,以 OpenAICEO Altman 在推特上回复马斯克的留言可知,ChatGPT 平均一次聊天成本为几美分。根据Similar Web 数据,2023 年1月 27 日至 2 月 3 日 ChatGPT 日活跃用户达 2500 万人。中性假设下,以平均单人单日对话 7 次,每次 3 美分成本进行测算,对应一年支出对话成本约为19.2 亿美元。根据英伟达官网,A100 作为 DGX A100 系统的一部分进行销售,该系统搭载 8个 A100 GPU,一个由 5 台 DGX A100 系统组成的机架可替代一个包括 AI 训练和推理基础设施的数据中心,且功耗仅为其 1/20,成本为其 1/10,系统售价 19.9 万美元。因此,在中性假设条件下,考虑到服务器约占数据中心成本的 70%(中商产业研究院),则 ChatGPT 运营一年将需要 6741 个 DGX A100 系统用于支撑访问量。

ChatGPT带动大模型竞品发布,海内外科技巨头先后加码AI布局。

1)谷歌向AI公司Anthropic投资近 4 亿美元,后者正在测试生成式 AI 工具 Claude,且谷歌也推出对标 ChatGPT 的聊天机器人 Bard。

2)微软以 100 亿美元投资 ChatGPT 的开发商 OpenAI,并获得其 49%股权。2023年 2 月,微软发布基于 ChatGPT 的 new Bing。

3)亚马逊云服务 AWS 宣布与 AI 公司 HuggingFace 开展合作,Hugging Face 将在 AWS 上开发针对 ChatGPT 的开源竞品,构建开源语言模型的下个版本 Bloom。

4)阿里达摩院正研发类 ChatGPT 的对话机器人,目前已处于内测阶段。

5)百度开发类 ChatGPT 项目“文心一言”(ERINE Bot)。

6)京东推出产业版 ChatJD。

912fdbb6-dcae-11ed-bfe3-dac502259ad0.png

9149da5c-dcae-11ed-bfe3-dac502259ad0.png

基于昆仑芯+飞桨+文心大模型 AI 底座,百度推出“文心一言”拉开国产生成式 AI 序幕。2023年 3 月 16 日,百度正式推出国内首款生成式 AI 产品“文心一言”,可支持文学创作、文案创作、数理推算、多模态生成等功能,目前已有多家厂商宣布接入。“文心一言”基于全栈自研的 AI 基础设施进行学习和训练:

 昆仑芯 2 代 AI 芯片:“文心一言”的芯片层核心能力,采用自研 XPU-R 架构,通用性和性能显著提升;256 TOPS@INT8 和 128 TFLOPS@FP16 的算力水平,较一代提升 2-3 倍,保障“文心一言”算力需求;采用 7nm 先进工艺,GDDR6 高速显存,支持虚拟化,芯片间互联和视频编解码等功能。

 飞桨深度学习平台:“文心一言”的框架层核心能力,系业内首个动静统一的框架、首个通用异构参数服务器架构,支持端边云多硬件和多操作系统,为文心大模型提供有效、快捷、完整的训练框架。

 文心知识增强大模型:“文心一言”的模型层核心能力,该产品主要采用 ERNIE 系列文心NLP 模型,拥有千亿参数级别的 ERNIE 3.0 Zeus 为该系列最新模型,进一步提升了模型对于不同下游任务的建模能力,大大拓宽了“文心一言”的应用场景。

以 GPT-3 为例测算:大算力需求驱动 AI 硬件市场空间提升

GPT-3(Generative Pre-trained Transformer 是 GPT-3.5 的上一代语言模型,目前一般所说的 GPT-3 即为拥有 1750 亿参数的最大 GPT-3 模型,OpenAI 在公开发表的论文《Language Models are Few-Shot Learners》中对 GPT-3 模型进行了详细分析。对于以 ChatGPT 为例的大模型算力需求,根据测算,我们预计用于高端 GPGPU 显卡的训练及推理部分市场空间合计约 145.32 亿元,其中训练市场规模为 27.84 亿元,推理市场规模为 117.48 亿元。

915a3e2e-dcae-11ed-bfe3-dac502259ad0.png

英伟达引领硬件端产品升级,国产 GPU 静待花开

大 GPU 优势在于通过并行计算实现大量重复性计算。GPGPU(General Purpose GPU)即通用GPU,能够帮助 CPU 进行非图形相关程序的运算。在类似的价格和功率范围内,GPU 能提供比CPU 高得多的指令吞吐量和内存带宽。

GPT-4 模型算力需求扩增,架构升级降本增效未来可期

根据 OpenAI 官网显示,目前 GPT-4 每 4 小时只能处理 100 条消息,且并没有开放图片识别功能。大模型升级带来的运算需求逐渐加码,且可推测目前算力已处于供不应求状态。

多模态拓展,图片识别算力需求升级十倍以上。关于从图片到 token 的转换方式,OpenAI 未公布 GPT-4 的模型参数,假设 GPT-4 处理图片视觉任务使用 VisionTransformer 模型(ViT),则输入图片尺寸必须为 224×224(ViT-B/16 版本)。根据 2021 年 ICLR 论文,模型原理大致为把一张图片分成 nxn 个 Patch,每一个 Patch 作为一个 Token。即把一张 224×224×3 的图片,切分为 16×16 大小的 Patch,每个 Patch 是三通道小图片,得到 16×16×3=768 个 token并作为向量输入。相较之下,根据前文 GPT-3 部分假设,假设每个文字问题 50-100 词,即67-133token。我们可以粗略推论,图像识别的所需算力是文字推理部分所需算力的十倍以上级别。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI芯片
    +关注

    关注

    17

    文章

    1831

    浏览量

    34702
  • 聊天机器人
    +关注

    关注

    0

    文章

    327

    浏览量

    12264
  • ChatGPT
    +关注

    关注

    28

    文章

    1519

    浏览量

    7051

原文标题:ChatGPT大模型,引领海内外巨头竞品发布

文章出处:【微信号:AI_Architect,微信公众号:智能计算芯世界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    跨越万里 | 是什么吸引众多海内外客户来访有行鲨鱼?

    八月夏末,九月秋初,有行鲨鱼凭借优越的产品性能、创新的研发理念以及卓越的市场表现,吸引了众多海内外客户纷纷来访考察。 在来访过程中,公司副总经理张亚杰先生热情地向客户展示了有行鲨鱼在粘接材料领域的智能化生产及精细化管理模式,并深入介绍了如何通过科研创新能力实施差异化战略,以推动企业的持续创新与发展。
    的头像 发表于 09-11 16:47 139次阅读
    跨越万里 | 是什么吸引众多<b class='flag-5'>海内外</b>客户来访有行鲨鱼?

    模型LLM与ChatGPT的技术原理

    在人工智能领域,大模型(Large Language Model, LLM)和ChatGPT等自然语言处理技术(Natural Language Processing, NLP)正逐步改变着人类
    的头像 发表于 07-10 10:38 459次阅读

    llm模型chatGPT的区别

    ,有许多不同的LLM模型,如BERT、GPT、T5等。 ChatGPT是一种基于GPT(Generative Pre-trained Transformer)模型的聊天机器人。GPT模型
    的头像 发表于 07-09 09:55 525次阅读

    名单公布!【书籍评测活动NO.34】大语言模型应用指南:以ChatGPT为起点,从入门到精通的AI实践教程

    联系,视为放弃本次试用评测资格! 2018 年,OpenAI 发布了首个大语言模型——GPT,这标志着大语言模型革命的开始。这场革命在 2022 年 11 月迎来了一个重要的时刻——OpenAI
    发表于 06-03 11:39

    OpenAI 深夜抛出王炸 “ChatGPT- 4o”, “她” 来了

    当地时间5月13日OpenAI推出ChatGPT-4o,代表了人工智能向前迈出的一大步。在GPT-4turbo的强大基础上,这种迭代拥有显著的改进。在发布会的演示中,OpenAI展示该模型的高级
    发表于 05-27 15:43

    苹果拟推出自研大语言模型Ajax,以优化iOS 18,但排除ChatGPT等选项

    早在2023年7月,Ajax模型就曾引发关注。该模型采用Google的Jax机器学习框架,运行在谷歌Cloud平台上,被部分工程师称为“Apple GPT”,与OpenAI的ChatGPT、微软的Bing以及谷歌的Bard等大语
    的头像 发表于 05-06 15:25 324次阅读

    KIMI与海内外主流模型对比及应用方向

    从目前来看,KIMI的参数量还能够增长数倍,这对发展来说是必要的。尽管存在一些稀疏化技术,但大模型训练对算力的需求仍然在不断增加。我们之前也做过10万亿参数的模型,并证明了大参数模型对训练算力是一个重要的因素。
    的头像 发表于 03-26 11:20 904次阅读

    谷歌发布轻量级开源人工智能模型Gemma

    谷歌近日宣布推出开源人工智能(AI)模型系列Gemma,旨在为开发人员和研究人员提供一个负责任的AI构建平台。这一举措标志着自2022年OpenAI的ChatGPT引领AI聊天机器人热潮后,谷歌首次
    的头像 发表于 02-23 11:38 710次阅读

    sora模型发布 sora模型对现实产生的影响有多大

    。 Sora发布后,OpenAI的估值迅速上涨(有望超过800亿美元,2023年ChatGPT发布不久时其估值约为290亿美元),且文生视频大模型将会大幅推动人工智能基础设施的需求,英
    的头像 发表于 02-22 17:05 1154次阅读

    【国产FPGA+OMAPL138开发板体验】(原创)6.FPGA连接ChatGPT 4

    方面。而且,由于ChatGPT 4是一个大型的语言模型。通常,FPGA会用于处理一些底层的数据流或执行特定的硬件加速任务,而ChatGPT 4这样的模型则会在云端或高性能服务器上运行。
    发表于 02-14 21:58

    激光雷达海内外厂商梳理

    Aeva的激光雷达传感器采用先进的调频连续波(FMCW)技术,可以实现高精度的距离和速度测量,以及高分辨率的点云成像。这使得传感器能够准确检测和识别车辆周围的所有物体,包括行人、车辆和障碍物,最远可以探测到 500米外的物体。
    发表于 12-21 16:57 937次阅读
    激光雷达<b class='flag-5'>海内外</b>厂商梳理

    ChatGPT原理 ChatGPT模型训练 chatgpt注册流程相关简介

    的影响,其注册相对繁琐。那么国内如何注册ChatGPT账号?本文跟大家详细分享GPT账户注册教程,手把手教你成功注册ChatGPTChatGPT是一种自然语言处理模型
    的头像 发表于 12-06 16:28 741次阅读
    <b class='flag-5'>ChatGPT</b>原理 <b class='flag-5'>ChatGPT</b><b class='flag-5'>模型</b>训练 <b class='flag-5'>chatgpt</b>注册流程相关简介

    不到1分钟开发一个GPT应用!各路大神疯狂整活,网友:ChatGPT就是新iPhone

    这个说法并不准确。尽管ChatGPT等语言模型已经在一定程度上改变了我们获取信息、学习知识的方式,但它们并不能替代人类进行创造性思考和创造性活动。 虽然一些人可能会利用ChatGPT等语言模型
    发表于 11-19 12:06

    ChatGPT重磅更新 OpenAI发布GPT-4 Turbo模型价格大降2/3

    ChatGPT重磅更新 OpenAI发布GPT-4 Turbo模型价格大降2/3 目前OpenAI算是全球大模型引领者,一举一动都牵动着大
    的头像 发表于 11-07 18:20 2621次阅读
    <b class='flag-5'>ChatGPT</b>重磅更新 OpenAI<b class='flag-5'>发布</b>GPT-4 Turbo<b class='flag-5'>模型</b>价格大降2/3

    受到海内外广泛认可的“山海之梦”!洲明科技提供所有数字内容

    淡妆浓抹总相宜,这是“诗意的杭州”;智慧亚运、爱达未来,这是“活力的杭州”;而若盘点起亚运赛场内外的硬核技术,就会发现“科技的杭州”。  10月1日起,全球首个原创剧场式交互山海经光显艺术展《寻迹之
    的头像 发表于 10-12 10:04 1181次阅读