0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为了供应,英伟达将GPU装换为AI引擎

芯片半导体 来源:半导体行业观察 2023-08-10 14:39 次阅读

据金融时报报道,中国的互联网巨头正争相采购对构建生成人工智能系统至关重要的高性能英伟达芯片,由于担心美国将实施新的出口管制,中国的互联网巨头们纷纷购买了价值 50 亿美元的订单。

据多位知情人士透露,百度、字节跳动、腾讯和阿里巴巴已下达价值 10 亿美元的订单,从这家美国芯片制造商采购约 10 万颗 A800 处理器,并将于今年交付。两位接近 Nvidia 的人士表示,中国集团还购买了价值 40 亿美元的图形处理器,将于 2024 年交付。

领先的云 GPU 提供商表示,Nvidia 最好的 AI 芯片在 2024 年之前的产能已经售罄。

Nvidia的产品现已成为科技行业最宝贵的资源。企业和初创企业正在疯狂地将预算重点转向新的人工智能项目,并迫切需要 GPU。亚马逊网络服务首席执行官 Adam Selipsky在本周接受 The Verge 采访时表示:“[Nvidia GPU] 供不应求”。

“我认为,至少在短期内,英伟达需求超过供应,这一点毫无争议,对每个人来说都是如此。”Adam Selipsky补充说。

Adam Selipsky进一步指出,生成式人工智能并不便宜。目前它的价格非常昂贵。GPU 的性能非常好,但也相当昂贵。例如,训练模型的成本非常昂贵。然后,运行推理或运行模型并在生产中对这些模型进行查询也非常昂贵。因此为了经济地完成这些任务,您需要云。绝大多数公司都需要像 AWS 这样的公司进行创新,随着时间的推移大幅降低成本,以推动我们不可避免地希望看到生成式 AI 使用量的指数级增长。

CoreWeave 联合创始人兼首席技术官 Brian Venturo在接受Barron's Tech的采访时也表示,今年第一季度,确保供应链中的 [GPU] 分配和产能仍然相当容易。从四月初开始,市场变得异常紧张。交货时间从合理到年底。[这一转变]发生在一周内。不仅仅是云服务提供商,他们已经有了自己的分配。这都是增量需求。它来自大型企业和人工智能实验室。

他表示,任何对物流和资源规划进行合理规划的人现在都在关注 2024 年第一季度至 2024 年第二季度。而CoreWeave也将开始为明年第二季度和第三季度的部署进行采购。

在问到为何大家都在抢购英伟达GPU时,Brian Venturo指出,英伟达的护城河是双重的。

首先是硬件方面。没有人比英伟达更擅长制造芯片。其次是软件。上市时间对于初创企业来说非常重要。如果您需要重组整个技术堆栈以使用 AMD 或 TPU [来自 Google 的张量处理单元],那么您可能会失去市场机会,这是宝贵的时间。

Nvidia 在 CUDA(软件编程平台)生态系统上进行了大量投资,他们的先见之明令人难以置信。他们现在基本上领先其他人10年。这不仅仅是 Nvidia 的 10 年,而是他们的客户和开发人员在该生态系统(使用软件工具和库)上构建的 10 年,利用了其他人之前的工作。我认为在短期甚至中期内没有其他人能够超越 Nvidia。

使用 Google 的 TPU 和 AWS Trainium 加速器的问题被锁定在具有非常具体的技术解决方案的供应商身上。对于初创企业来说,这可能不是最好的选择。您希望供应商具有灵活性,因为您知道可以在多个地方获得相同的东西。

[Nvidia 的专有网络] InfiniBand 还提供了当今最好的解决方案来最大限度地减少延迟。其他产品不具备拥塞控制和使工作负载发挥最佳性能的功能。

为了供应,英伟达将GPU装换为AI引擎

为了缓解GPU 挤压的压力,Nvidia 的 RTX GPU(主要以游戏和图形闻名)正在为对桌面 AI 感兴趣的爱好者进行配置和重新包装。新的 GPU 是 Nvidia 使 GPU 在客户需要时随时随地可用的方法的一部分。

该公司发布了 RTX GPU,可用于人工智能推理和训练。GPU基于Ada Lovelace架构,与供不应求的红热H100 GPU中使用的Hopper架构不同。

爱好者已经在游戏笔记本电脑上使用 GPU 来运行人工智能驱动的应用程序,例如文本到文本或文本到图像模型。在本周的 SIGGRAPH 会议上,Nvidia 宣布了采用 RTX GPU 的新桌面和工作站设计。

包括戴尔、联想和 Boxx 在内的计算机制造商将推出可在机箱中容纳多达四个 RTX 6000 数据生成的工作站。Nvidia 表示,该 GPU 的建议零售价为 6,000 美元,但戴尔等供应商的售价(含税)超过 9,000 美元。

每个 RTX 6000 GPU 均基于 Ada Lovelace 设计,拥有 48GB GDDR6 内存和 200Gbps 网络接口卡。GPU 的功耗为 300 瓦,基于较旧的 PCIe 4.0 互连标准。

Nvidia还发布了L40S Ada GPU,它更像是H100的穷人版本,因为它在AI训练和推理方面比上一代A100 GPU更快。新产品是一年前发布的L40服务器GPU的变体。

L40S 还具有 48GB GDDR6 内存,并将应用于基于 OVX 参考服务器设计的系统中,用于 Metaverse 应用程序。

与基于上一代 Ampere 架构的上一代 A40 GPU 相比,L40S 的 AI 和图形工作负载速度提高了四倍。AI训练速度比A100 GPU快1.7倍,推理速度快1.5倍。L40S 具有更快的时钟速度和更高的张量和图形渲染性能。

Nvidia 的企业 RTX 系统是为 Metaverse 和 AI 市场打造的,新硬件将包括 Omniverse 和 AI Enterprise 软件的许可证。该公司还发布了 AI Enterprise 4.0,其中将包括 Nemo 大语言模型。

购买将于今年晚些时候发货的 L40S GPU 电源应该不会有什么困难。

Nvidia 专业可视化副总裁 Bob Pette 在新闻发布会上表示:“这些不会像我们在一些最高端 GPU 中那样受到限制。”

Nvidia 的低端 RTX 4000 GPU 将于 9 月上市,售价为 1,250 美元。RTX 4500 将于 10 月开始发售,售价为 2,250 美元。

对于 Nvidia 来说,人工智能与游戏一样重要。该公司希望让 GPU 成为一种商品,爱好者可以在上面创建自己的程序,然后在最接近的 GPU 可用的地方运行。Nvidia 的 H100 GPU 很难找到,但已成为公司的资产。一家名为 CoreWeave 的初创公司已将其 Nvidia GPU 作为抵押品,为其发展提供资金。加密货币矿工也在重新利用数据中心的 GPU 来运行人工智能。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    46841

    浏览量

    237523
  • 英伟达
    +关注

    关注

    22

    文章

    3743

    浏览量

    90825
  • PCIe接口
    +关注

    关注

    0

    文章

    120

    浏览量

    9674
  • GPU芯片
    +关注

    关注

    1

    文章

    303

    浏览量

    5781
  • GDDR6
    +关注

    关注

    0

    文章

    52

    浏览量

    11297

原文标题:传中国厂商扫货英伟达GPU,豪掷50亿买芯片,订单已经排到2024年

文章出处:【微信号:TenOne_TSMC,微信公众号:芯片半导体】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    英伟或明年革新AI GPU设计,采用插槽设计

    10月11日最新消息,集邦咨询Trendforce于今日(10月11日)发表博文透露,英伟预计在今年第四季度推出GB200后,正考虑在其下一代AI GPU产品中采纳独立
    的头像 发表于 10-11 17:05 401次阅读

    Inflection AI转向英特尔Gaudi 3,放弃英伟GPU

    近日,人工智能技术公司Inflection AI宣布了一项重要决策,其最新的企业平台放弃采用英伟(Nvidia)的GPU,转而选择英特尔
    的头像 发表于 10-10 17:21 438次阅读

    英伟AI服务器革新采用插槽式设计

    英伟AI服务器领域即将迎来重大变革。据里昂证券最新发布的报告预测,从明年下半年起,英伟的旗舰级AI
    的头像 发表于 09-27 11:47 336次阅读

    英伟全面转向开源GPU内核模块

    英伟公司近期宣布了一项重大决策,即全面转向开源GPU内核模块,并计划最终以此取代闭源驱动程序。这一战略转变标志着英伟在开源领域迈出了重要
    的头像 发表于 07-19 15:26 534次阅读

    欧盟警告英伟AI芯片供应垄断趋势

    欧盟竞争事务专员玛格丽特·维斯塔格近日在新加坡之行中发出警告,指出英伟公司在人工智能(AI)芯片供应方面存在垄断趋势,这一表态立即引起了业界和市场的广泛关注。维斯塔格明确表示,虽然监
    的头像 发表于 07-08 11:52 368次阅读

    英伟GPU新品规划与HBM市场展望

    在COMPUTEX 2024主题演讲中,英伟(NVIDIA)公布了其GPU产品的未来规划。据英伟透露,B100、B200和GB200系列
    的头像 发表于 06-13 09:44 760次阅读

    英伟推出融合Arm与Blackwell内核的AI PC芯片

    近日,业内传出英伟正在研发一款全新芯片的传闻。据悉,这款芯片结合下一代Arm Cortex CPU内核与英伟自家的Blackwell
    的头像 发表于 05-31 10:31 569次阅读

    英伟首席执行官黄仁勋:AI模型推动英伟AI芯片需求

    近来,以ChatGPT为代表的AI聊天机器人已经导致英伟AI芯片供应紧张。然而,随着能够创造视频并进行近似人类交流的新型
    的头像 发表于 05-24 10:04 457次阅读

    CoWoS先进封装产能吃紧,英伟GPU供应依旧受限

    英伟占据全球AI GPU市场约80%的份额,根据集邦咨询预测,到2024年,台积电CoWoS月产能有望增至4万片,并在明年底实现翻番。然而,随着
    的头像 发表于 05-20 11:58 450次阅读

    进一步解读英伟 Blackwell 架构、NVlink及GB200 超级芯片

    2024年3月19日,[英伟]CEO[黄仁勋]在GTC大会上公布了新一代AI芯片架构BLACKWELL,并推出基于该架构的超级芯片GB200,助推数据处理、工程模拟、电子设计自动化
    发表于 05-13 17:16

    英伟、AMD、英特尔GPU产品及优势汇总

    电子发烧友网报道(文/李弯弯)随着人工智能技术的快速发展,GPU的市场规模在全球范围内持续提升。目前,GPU市场主要由英伟、AMD和英特尔等几家大公司主导。其中,
    的头像 发表于 05-10 00:59 4829次阅读

    国内GPU新势力:能否成为英伟的“终结者”?

    ,随着中国国内科技企业的快速发展和技术创新,一个问题自然而然地浮现出来:中国国内的GPUAI供应商是否有望追赶上英伟
    的头像 发表于 04-24 11:07 424次阅读
    国内<b class='flag-5'>GPU</b>新势力:能否成为<b class='flag-5'>英伟</b><b class='flag-5'>达</b>的“终结者”?

    英伟发布新一代AI芯片架构Blackwell GPU

    近日,英伟首席执行官黄仁勋在GTC 2024会议上发表主题演讲,重磅推出全新AI芯片架构Blackwell GPU。这一创新技术的首款芯片产品命名为GB200,标志着
    的头像 发表于 03-26 11:19 820次阅读

    英伟华为认定为“最大竞争对手”的原因

    英伟指出,华为在供应图形处理器(GPU)、中央处理器(CPU)等用于AI的芯片领域,都可与业界竞争。
    的头像 发表于 02-27 11:11 937次阅读

    英伟AI设计GPU算术电路有何优势

    大量的算术电路阵列为英伟GPU提供了动力,以实现前所未有的AI、高性能计算和计算机图形加速。因此,改进这些算术电路的设计对于提升 GPU
    发表于 12-05 11:05 403次阅读