0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达缺货?OpenAI选择自研芯片

E4Life 来源:电子发烧友网 作者:周凯扬 2024-01-30 00:51 次阅读

电子发烧友网报道(文/周凯扬)在生成式AI和大模型带来的AI洪流下,不少大厂都不约而同地选择了自研AI芯片。即便这意味着组建新的团队,花费大量的资金,但从长远发展的角度来看,自研芯片似乎成了势在必行。然而掀起这股AI洪流,或者说将其推向浪尖的“始作俑者”,OpenAI,却也已经在计划着自研芯片。

有了英伟达供应的前提下为何要走向自研之路

稍有关注OpenAI动向的话,想必也对2023年底OpenAI闹出的离职风波有所耳闻。据外网报道,在OpenAI闹剧期间,Sam Altman已经在秘密筹划一项数十亿美元的芯片项目(据称项目名为Tigris)。甚至其去年的中东之行,就是为了给这一项目筹集资金。

在各大公司都选择批量扫货的前提下,去年用于AI服务器的英伟达GPU处于一个极度缺货的状态,比如Meta就在月初宣布计划再购买35万块英伟达的H100 GPU。就连为OpenAI提供服务器的微软,也面临着扩大AI服务器规模的困难。为此微软也在加快内部AI芯片的研发进程,但微软的这一芯片必然不是单纯为了OpenAI打造的,而是面向所有Azure的客户。

更别说OpenAI面临着超高的运维成本,网传OpenAI每天的服务器运维费用高达70万美元。
在如此高昂的服务器硬件与运维成本下,OpenAI也开展了相关的订阅收费模式ChatGPT Plus,费用为20美元每月。

但据统计,去年10月份ChatGPT Plus的订阅用户只有20多万,这样的用户规模根本没法覆盖运维支出。更何况因为硬件资源的限制,OpenAI一直在限制ChatGPT Plus的订阅用户规模,以免出现服务器负载过高的情况。

为此,OpenAI要想进一步降本增效,并保证下一代GPT模型能有足够的算力支撑,走上自研这条路倒也情有可原。由OpenAI自研的芯片,自然会专为GPT模型作针对性的优化,也有利于未来的模型与硬件迭代。

从资金、设计到制造,OpenAI寻求外援

然而自研造芯不仅需要组建一个设计团队,也需要半导体制造厂商的支持,更别说打造高性能AI芯片的资金了。据了解,阿布扎比的G42和日本的软银已经与Sam Altman展开合作交谈,这些投资者将为OpenAI提供足够的资金来打造一个AI芯片的制造网络。

据传这一投资也拉到了台积电的合作,后者将为其提供芯片的支持。要知道目前用于AI芯片的CoWoS先进封装产能可是炙手可热,即便台积电在积极扩产,但在源源不断的制造订单下,可能仍然难以满足云服务厂商和互联网厂商们的AI芯片需求。

再者就是HBM的产能,除了算力对逻辑芯片提出的高要求外,AI应用所需的高带宽也对存储芯片提出了不少的要求,甚至在近年推出的一大批AI芯片中,HBM内存已经成了标配。可HBM有限的制造厂商们却面临着产能紧缺的问题,比如SK海力士就透露其2024年的HBM3和HBM3E产能已经全部售罄,甚至已经在和客户商讨2025年的订单。

其实早在去年6月,Sam Altman就曾访问韩国,并与韩国总统尹锡悦会面,并提议韩国应该多多关注芯片产能问题。上周,Sam Altman再度访韩,据悉其参观了三星电子的半导体产线,并会见了三星的芯片业务负责人,这之后又与SK海力士的CEO进行了会谈。此行的目的已经很明显了,这两大HBM厂商都已经打入了英伟达的AI芯片HBM内存供应链中,尤其是SK海力士。

OpenAI要想自研AI芯片,势必用上最新的HBM内存,那么与存储厂商直接预订产能是最好的选择。这也是自研AI芯片面临的难处之一,英伟达这类已经有大量订单和多年设计经验的厂商,在晶圆代工厂往往有着更大的话语权,能够抢占到更大的产能。如果OpenAI能够抛出大批量的订单的话,或许可以说动台积电、三星和SK海力士等厂商为其腾出额外的产能。

自研的其他捷径

对于OpenAI来说,自研AI芯片固然存在着很多阻碍,但在这个设计路线已经与过去大不相同的时期,也有不少捷径可走,比如Chiplet技术。谷歌TPU项目的负责人之一Richard Ho从去年11月起,已被OpenAI聘请为硬件部门的负责人。但从其公开招募的职位来看,OpenAI还没有大规模组建硬件设计团队。

即便如此,OpenAI依然有着缩短芯片设计周期的手段,那就是通过Chiplet技术,降低设计芯片的工程量。其自研的部门只需要涵盖芯片的逻辑计算部分,其余的I/O等模块,均可以靠第三方IP打造的Chiplet进行实现。

如此一来不仅可以充分利用异构集成的高性价比,也可以通过重复利用IP来避免反复造轮子的情况,也更容易实现芯片的迭代,不需要组建一整个大型硬件设计团队,从而将更多精力放在计算核心的设计,以及与软硬件的联调上。更重要的是KGD的优势保证了Chiplet的良率,也就直接提高最终AI芯片成品的良率,对于新晋芯片设计厂商而言,这能有效地降低制造分享。

写在最后

从OpenAI或将自研芯片的动向或传言来看,AI的框架和应用走向成熟和爆红,仅仅只是实现成功的第一步。要想实现可持续的商业化落地,还是少不了硬件的支撑,尤其是与模型契合的AI芯片。所以只要是可以负担得起大投入和高风险的AI公司,都会考虑自研专用AI芯片。

同时,我们也可以看出OpenAI的野心确实不小,不少AI模型/应用开发商并没有这个魄力去选择自研的道路,因为绝大多数竞争对手的运营方式还是靠服务器托管,以订阅制或Token数来进行收费,其用户量也还没达到云服务厂商难以维系的程度。而OpenAI凭借ChatGPT成为落地AI应用的领头羊,甚至不少云服务厂商亲自下场也没能实现ChatGPT的热度。或许对于OpenAI而言,自研芯片固然风险极高,却依然是推动公司进入下一阶段的最优解。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3743

    浏览量

    90806
  • OpenAI
    +关注

    关注

    9

    文章

    1042

    浏览量

    6403
收藏 人收藏

    评论

    相关推荐

    AI大模型不再依赖英伟GPU?苹果揭秘大模型

    ,获得足够的算力构建自己的计算中心,用于训练不同应用的AI模型。 AI领域众星捧月也造就了英伟市值曾突破三万亿美元,并短暂登顶全球第一的位置。不过苹果却反其道而行之,在7月底苹果公司揭露的官方论文显示,苹果
    的头像 发表于 08-05 06:07 3888次阅读
    AI大模型不再依赖<b class='flag-5'>英伟</b><b class='flag-5'>达</b>GPU?苹果揭秘<b class='flag-5'>自</b><b class='flag-5'>研</b>大模型

    OpenAI与博通洽谈合作!定制化ASIC芯片走向台前,英伟GPU迎来“劲敌”?

    电子发烧友网报道(文/李弯弯)为了减轻对英伟的依赖,OpenAI一直在推进芯片计划。7月1
    的头像 发表于 07-20 00:02 4748次阅读
    <b class='flag-5'>OpenAI</b>与博通洽谈合作!定制化ASIC<b class='flag-5'>芯片</b>走向台前,<b class='flag-5'>英伟</b><b class='flag-5'>达</b>GPU迎来“劲敌”?

    OpenAI调整硬件战略:2026年起将自AI芯片

    10月30日,路透社发布消息称,OpenAI正着手调整其硬件战略,旨在优化计算资源配置并削减成本。此次调整中,OpenAI将引入AMD的MI300系列芯片,并继续保留对英伟
    的头像 发表于 10-30 16:23 344次阅读

    苹果、英伟或携手参投OpenAI新一轮融资

    科技巨头苹果(Apple)与英伟(NVIDIA)正积极磋商,拟加入OpenAI即将启动的新一轮融资,此举有望将OpenAI的估值推向前所未有的高度——超过1000亿美元大关。若苹果与
    的头像 发表于 08-30 15:32 384次阅读

    AI芯片巨头英伟涨超4% 英伟市值暴增7500亿

    谁是美股最靓的仔?在人工智能浪潮之下AI芯片巨头英伟肯定有一席之地,特别是现在全球资本市场动荡之际,业界分析师多认为英伟是最佳“反弹股”
    的头像 发表于 08-13 15:33 1055次阅读

    科技看点:摩根大通详解“英伟芯片问题”马斯克560亿薪酬方案引争议

    给大家分享一些科技巨头的最新消息: 摩根大通详解“英伟芯片问题” 在摩根大通的一份报透露出“英伟
    的头像 发表于 08-05 16:18 608次阅读

    亚马逊AWSAI芯片崛起,挑战英伟

    原话强调道:“在特定情况下,这款芯片的性能表现相较于英伟达产品可以实现高达40%到50%的提升,因此它的制造成本应仅为采用英伟同类产品的一半左右。”
    的头像 发表于 07-27 14:33 998次阅读

    OpenAI芯片计划调整,传交台积电生产

    近日,全球领先的生成式AI应用大厂OpenAI芯片领域迎来了重大战略调整。为降低对外部AI芯片的依赖,
    的头像 发表于 07-23 16:52 641次阅读

    华与英伟深化合作,成为NVIDIA AI Enterprise软件全球分销商

    近日,华宣布扩大与英伟的合作,未来将通过工业级边缘计算和英伟 AI Enterprise 软件平台提升全球企业的AI生产力。
    的头像 发表于 05-10 10:25 406次阅读

    英伟首次向OpenAI供应AI服务器,鸿海出货预期将增长

    2017年起,鸿海便开始与英伟合作开发服务器,其中包括世界上首台AI服务器HGX1。值得注意的是,OpenAI成立之初,有一张照片展示了黄仁勋赠予马斯克一台AI服务器,并在其上签名
    的头像 发表于 04-26 16:18 875次阅读

    微软正开发英伟网卡的替代品

    微软公司,全球科技巨头,正在研发一种新型网卡,旨在提升其人工智能芯片Maia的性能,并减少对英伟达产品的依赖。据称,这款新型网卡的设计和功能与
    的头像 发表于 02-21 11:06 774次阅读

    微软正在研发新型网卡,旨在提升AI芯片性能

    微软近日被曝正在秘密研发一款高性能的新型网卡,这一创新旨在增强其的Maia AI服务器芯片的功能,并可能大幅度降低对外部芯片设计厂商如英伟
    的头像 发表于 02-21 11:01 696次阅读

    英伟涉足定制芯片,聚焦云计算与AI市场

     作为全球高端AI芯片市场80%份额的霸主,英伟2023以来股价上涨超过两倍,2024年市值高达1.73万亿美元。知名公司如微软、OpenAI
    的头像 发表于 02-18 11:08 632次阅读

    英伟注资聊天机器人制造商Kore.ai,进军人工智能市场

    近年来,英伟与新兴人工智能科技公司展开频繁合作,如Hugging Face、Cohere和Mistral AI。其顶级芯片系统在生成式AI的训练和开发过程中发挥着关键作用。去年
    的头像 发表于 01-31 10:02 605次阅读