0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AIGC需求大爆发,英伟达算力芯片已涨价近四成

Felix分析 来源:电子发烧友网 作者:吴子鹏 2023-05-16 01:08 次阅读

电子发烧友网报道(文/吴子鹏)日前,有代理商透露,英伟达的A100价格从2022年12月份开始上涨,截至2023年4月上半月,5个月价格累计涨幅达到37.5%;在中国市场,A800价格从2022年12月份开始上涨,截至2023年4月上半月,5个月价格累计涨幅达20.0%。

目前,对于所有AI大模型而言,无论是推理还是训练,基本都是依赖英伟达的GPU芯片。其中,英伟达A100芯片是目前的主流,在大模型训练市场的市占比接近100%。

英伟达算力芯片量价齐升

根据此前的公开报道,OpenAI的GPT-3大模型参数规模已经达到1750亿,因此在训练过程中需要做大量的数据并行计算,这就是为什么AI 大模型都要哄抢GPGPU。

所谓的GPGPU又名通用算力GPU,能够帮助CPU进行非图形相关程序的运算——复杂的数值计算、物理模拟和数据分析等任务。GPGPU在进行相关运算时有几大突出的优势,高效并行性、高密集运算、超长流水线等。

那么,为什么只有英伟达有AI淘金浪潮“卖铲人”的称号呢?

主要原因有两点,其一是英伟达芯片的算力更高,比如英伟达的A100,这颗采用Ampere架构和7nm制程的芯片里晶体管数量达542亿颗,单芯片可提供的FP32峰值算力为19.5TFLOPS。如果是英伟达的H100 SXM,FP32峰值算力为67TFLOPS,提升明显。并且,无论是A100还是H100都能够提供包括FP64、TF32、FP32、FP16 和INT8在内的所有算力精度。

在高算力方面,我们都知道,先进芯片和先进算力之间并不是画等号的,在算力集群里,传输也是极为重要的。为了保障传输,英伟达给H100配备了可提供 900 GB/s GPU 间互连的第四代NVlink、可跨节点加速每个GPU通信的NVLINK Switch系统、PCIe 5.0,以保障高效的算力集群。即便是目前主流的A100,英伟达也是为其配备了2TB/s的内存带宽,以及NVIDIA NVLink、NVIDIA NVSwitch、PCIe 4.0,用以保障传出。

其二是生态的优势。英伟达长期占据GPGPU的头把交椅,并在此过程中持续完善自己的生态。在算力利用的过程中,无论是学习、运算还是开发,往往都需要一个统一的开发架构,优秀的架构才能尽可能释放GPGPU的算力。在这方面,公开数据显示,英伟达的CUDA占据了全球大概80%以上的市场。其他公司做的基本都是对标CUDA,比如OpenAI的开发架构Triton,业界往往认为其是简化版的CUDA。目前,市场上很多芯片只能从理论算力上去对标英伟达,宣称能够达到英伟达某款芯片的几成,然而在实际应用中由于软件生态的缺失,是要进一步打折扣的。

算力和生态的优势让行业界对英伟达的A100和A800趋之若鹜。有代理商爆料称,目前英伟达主流算力芯片不仅价格走高,同时交货周期也被拉长,之前拿货周期大约为一个月,现在基本都需要三个月或更长。甚至,部分新订单“可能要到12月才能交付”。

产业苦英伟达久矣

目前,英伟达的GPGPU可以说就是AI大模型部署算力的标准。有专家曾表示,做好AI大模型的算力最低门槛是1万枚英伟达A100芯片。TrendForce研究则显示,以A100的算力为基础,GPT-3.5大模型需要高达2万枚GPU,未来商业化后可能需要超过3万枚。

业界还预估,国内大概只有3万块的英伟达A100芯片存量,其余用于AI大模型的都是新购进的A800特供版。因此,目前国内部分公司已经开始在内部做出限制,除AI大模型相关业务外,其余业务不允许使用A100或者A800提供的算力。

业界一边在尽力去追求英伟达的高端算力芯片,同时对于价格不断走高,且供货周期持续延长的英伟达芯片也是怨声载道。

因此,目前行业内不断有声音出现,要替代英伟达的相关芯片。

比如谷歌第二代TPU,在一些数据吞吐测试中,这款芯片已经能够和英伟达GPGPU相当。另外有分析师指出,由于一些公司买不到英伟达的高端GPGPU,因此选择将模型做小,然后选择AMD公司的CPU或者Cerebras的WSE来进行部署,进而促进了垂直领域和AI大模型的结合。

在国内,也已经有一些公司在推出方案,尝试在AI大模型领域取代英伟达的芯片。

后记

根据相关统计数据,英伟达A100芯片已经贡献目前全球数据中心和算力中心业务的50%,成为该公司的摇钱树。在国内市场,几天前的报道指出,A800芯片在国内售价被炒到超过10万元/颗,而且是低配的版本。然而,AIGC时代里,算力就是王道,因此算力芯片便物以稀为贵。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3514

    浏览量

    89039
  • AIGC
    +关注

    关注

    1

    文章

    297

    浏览量

    1249
收藏 人收藏

    评论

    相关推荐

    英伟达AI芯片需求激增,封测厂订单量或翻倍

    在全球半导体行业持续演进的背景下,英伟达(NVIDIA)的AI芯片需求正迎来前所未有的增长。据悉,英伟达GB200与B系列AI芯片
    的头像 发表于 06-24 18:05 1217次阅读

    存内计算WTM2101编译工具链 资料

    存内计算是突破物理极限的下一代技术- AIGC等人工智能新兴产业的快速发展离不开
    发表于 05-16 16:33

    进一步解读英伟 Blackwell 架构、NVlink及GB200 超级芯片

    2024年3月19日,[英伟]CEO[黄仁勋]在GTC大会上公布了新一代AI芯片架构BLACKWELL,并推出基于该架构的超级芯片GB200,将助推数据处理、工程模拟、电子设计自动化
    发表于 05-13 17:16

    能RADXA微服务器试用体验】Radxa Fogwise 1684X Mini 规格

    通过网络可以了解到,能RADXA微服务器的具体规格: 处理器:BM1684X :高达32Tops INT8峰值 内存:16GB L
    发表于 02-28 11:21

    “网红”芯片Groq让英伟达蒸发5600亿

    鉴于ChatGPT的广泛应用,引发了AI算力需求的迅猛增长,使得英伟达的AI芯片供不应求,出现大规模短缺。如今,英伟达似乎在面对更多挑战。
    的头像 发表于 02-27 15:10 655次阅读
    “网红”<b class='flag-5'>芯片</b>Groq让<b class='flag-5'>英伟</b>达蒸发5600亿

    大茉莉X16-P,5800M大称王称霸

    Rykj365
    发布于 :2024年01月25日 14:54:52

    英伟新显卡起售1.3万元

    英伟行业资讯
    深圳市浮思特科技有限公司
    发布于 :2023年12月29日 16:56:52

    《数据处理器:DPU编程入门》DPU计算入门书籍测评

    来说,DPU的需求也越来越大,大量边缘计算的需求在飙升,边缘数据预测,边缘决策,边缘图像识别,一个个需求都在暴增着未来Xlinx的业务肯
    发表于 12-24 10:54

    英伟达扩大台积电投片,满足AI处理器需求

    虽然美方的出口限制对英伟达的AI芯片销售造成困扰,但英伟达仍然依靠于各大核心客户如微软、Meta、谷歌、AWS、甲骨文和CoreWeave等强大的AI芯片
    的头像 发表于 12-15 09:38 413次阅读

    英伟将在越南设法人实体

    英伟行业资讯
    深圳市浮思特科技有限公司
    发布于 :2023年12月12日 10:29:04

    英伟HBM4预计2026年推出

    英伟行业资讯
    深圳市浮思特科技有限公司
    发布于 :2023年11月27日 15:15:17

    英伟为何放不下中国?

    英伟行业资讯
    深圳市浮思特科技有限公司
    发布于 :2023年11月27日 15:11:09

    #英伟 #显卡 英伟全新旗舰显卡RTX 5090性能暴涨70%

    显卡英伟
    深圳市浮思特科技有限公司
    发布于 :2023年11月20日 14:19:25

    #消费级显示被禁止出口 英伟RTX 4090显卡遭遇下架风波

    英伟
    深圳市浮思特科技有限公司
    发布于 :2023年10月19日 15:58:35

    英伟市值下跌看半导体行业的风云变幻

    半导体英伟
    北京中科同志科技股份有限公司
    发布于 :2023年10月19日 09:38:56