0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

不堪忍受英伟达霸权,微软、OpenAI纷纷自研AI芯片

科技云报到 来源:jf_60444065 作者:jf_60444065 2023-10-11 14:25 次阅读

科技云报道原创

英伟达是当之无愧的“AI算力王者”,A100、H100系列芯片占据金字塔顶尖位置,是ChatGPT这样的大型语言模型背后的动力来源。

但面对英伟达的独霸天下,科技巨头们都纷纷下场自研AI芯片。

10月6日,媒体援引知情人士消息称,微软计划在下个月的年度开发者大会上推出首款为人工智能设计的芯片,来降低成本并减少对英伟达的依赖。

同一天,据媒体消息显示,ChatGPT开发商OpenAI也正在探索AI芯片的可能性,并已评估潜在的收购目标,以加速自研芯片的研发。

事实上,不仅是微软、OpenAI试图自研AI芯片,AWS、谷歌、Meta等科技巨头都已下场自研。

在酝酿数年后,这是否意味着英伟达的独霸时代即将结束?

巨头纷纷自研AI芯片

目前,包括谷歌、AWS、阿里巴巴、百度、华为等国内外云服务大厂都已有自研 AI 芯片用于数据中心,微软和Meta也有相关计划。所以对于头部的AI技术大厂来说,自研AI芯片已经是一大趋势。

微软早就自研芯片

作为全球头部云厂商,微软Azure需要大量AI处理器。尤其是和OpenAI合作以后,有消息称微软至少订购了数十万颗英伟达芯片。

因此,这几年微软在芯片研发上加快了进程,先是建立由前英特尔高管Rani Borkar领导的芯片部门;后又各处招兵买马,其中就包括前苹果芯片架构师Filippo;此外还和AMD展开了密切合作。

自2019年以来,微软就开始研发一款名为"雅典娜"(Athena)的定制AI芯片,用于为大型语言模型提供动力,目前已在测试阶段。

Athena的首个目标是为OpenAI提供算力引擎,以替代昂贵的英伟达A100/H100。如果明年大规模推出,Athena将允许微软内部和OpenAI的团队同时训练和推理模型。

SemiAnalysis的分析师迪伦·帕特尔(Dylan Patel)表示,开发类似于雅典娜的芯片可能每年需要花费1亿美元左右,ChatGPT每天的运营成本约70万美元,大部分成本来源于昂贵的服务器,如果雅典娜芯片与英伟达的产品拥有同等竞争力,每个芯片的成本将可以降低三分之一。

有知情人爆料,微软在芯片研发上已砸入了近20亿美元。

OpenAI计划收购

据媒体消息称,OpenAI也正在探索制造自研人工智能芯片,并已开始评估潜在的收购目标。

报道称,至少从去年开始,OpenAI就已讨论各种方案,以解决AI芯片短缺问题。

OpenAI已将获取更多AI芯片列为公司首要任务,讨论方案包括自研AI芯片,与包括英伟达在内的其他芯片制造商更密切地合作,以及在英伟达之外实现供应商多元化。

谷歌最早自研TPU芯片

早在2013年,谷歌就已秘密研发一款专注于AI机器学习算法的芯片,并将其用在内部的云计算数据中心中,以取代英伟达的GPU

2016年5月,这款自研芯片公诸于世,即TPU。TPU可以为深度学习模型执行大规模矩阵运算,例如用于自然语言处理、计算机视觉推荐系统的模型,其最初专为谷歌的超级业务云计算数据中心而生。

2020年,谷歌实际上已在其数据中心部署了人工智能芯片TPU v4。

AWS推出训练和推理芯片

从2013年推出首颗Nitro1芯片至今,AWS是最先涉足自研芯片的云厂商,已拥有网络芯片、服务器芯片、人工智能机器学习自研芯片3条产品线。

2018年初,科技媒体Information爆料亚马逊已经开始设计定制AI芯片。

AWS自研AI芯片版图包括推理芯片Inferentia和训练芯片Trainium。2018年底,AWS推出自研AI推理芯片Inferentia,可以以低成本在云端运行图像识别、语音识别、自然语言处理、个性化和欺诈检测等大规模机器学习推理应用程序。

2020年底,AWS推出专用于训练机器学习模型的Trainium。

2023年初,专为人工智能打造的Inferentia 2发布。Inf2实例最多可支持1750亿个参数,这使其成为大规模模型推理的有力竞争者。

在AWS、微软和谷歌这三家中,亚马逊是唯一一家在服务器中提供两种类型芯片(标准计算芯片和用于训练与运行机器学习模型的专用芯片)的云提供商,其在2015年收购以色列芯片设计公司Annapurna Labs为这些努力奠定了基础。

Meta基于RISC-V开源架构自研

直到2022年,Meta Platforms还主要使用CPU和专为加速AI算法而设计的定制芯片组合来运行其AI工作负载。

后来,Meta取消了于2022年大规模推出定制芯片的计划,转而订购了价值数十亿美元的英伟达GPU。

如今为了扭转局面,Meta已经在开发内部芯片,并于5月19日公布了AI训练与推理芯片项目。

据介绍,MTIA芯片的功耗仅为25瓦,占英伟达等市场领先供应商芯片功耗的一小部分,并使用了RISC-V(第五代精简指令处理器)开源架构。

值得注意的是,Meta于5月初收购了英国AI芯片独角兽Graphcore的AI网络技术团队,为其自研AI芯片奠定了基础。

英伟达能否被撼动?

埃森哲公司报告指出,如今技术行业的AI渗透度明显高出其他行业,而未来企业的成长潜力取决于其能在多大程度上应用生成式AI。更关键的是,熟练运用新技术也将成为国家发展的关键。

如今,AI技术在数据中心、智能汽车、游戏等的应用落地方面取得了丰硕的成果,要实现AI大规模应用,背后必定要有大量AI芯片的算力支持。

数据显示,英伟达的GPU是全球应用最为广泛的 AI 芯片。

英伟达独立GPU市场份额达80%,在高端GPU市场份额高达90%。2020年,全世界跑AI的云计算与数据中心,80.6%都由英伟达GPU驱动。2021年,英伟达表示,全球前500个超算中,大约七成是由英伟达芯片驱动的。

显而易见,英伟达已经垄断了全球算力。

随着AWS、谷歌、微软等巨头加入自研AI芯片的道路,英伟达的垄断地位是否能被撼动呢?

首先,芯片设计技术非常复杂。

高算力芯片的首要挑战就是其复杂度,从芯片设计角度,高性能计算芯片中的计算单元、存储访问以及芯片间的互联都是需要仔细考虑。

英伟达之所以引领GPU创新,源于其架构底座不断迭代,从2008年的Tesla架构到2020年的Ampere架构,每一次都是对硬件的升级与改进。代际之间产品性能提升显著,性能和市场份额均领先全球。

其次,不可一世的CUDA生态。

比造芯更难的是搭建生态,全球GPU生态都来自CUDA。

CUDA,是英伟达2006年推出的通用并行计算架构生态,使GPU能够解决复杂的计算问题。

毋庸置疑,CUDA是迄今为止最发达、最广泛的生态系统,也是深度学习库最有力的支持。

虽然有PyTorch支持更多GPU厂商,再加上OpenAI的Triton搅局,但无法撼动CUDA的统治地位。

随着人工智能领域的蓬勃发展,GPU和CUDA被从业者视为标配,使用GPU做加速计算已成为行业主流。虽然英伟达GPU本身硬件平台的算力卓越,但其强大的CUDA软件生态才是推升GPU计算生态普及的关键力量。

当前CUDA 广泛功能已与英伟达GPU硬件深度耦合,开发者早已熟悉其专有的编程语言CUDA,用于制作GPU驱动的应用程序。

如果换到其他厂商的定制芯片,就需要学习全新的软件语言了,如何说服开发者使用这些AI芯片呢?

最后,芯片的具体生产也是一个挑战。

如何确保芯片生产的良率,以及如何在高级封装和先进工艺节点产能仍然有可能紧张的几年内,获得足够的产能以量产,也是各大巨头需要解决的问题。

总体而言,想要撼动英伟达的垄断地位,并不是一朝一夕的事。各大科技巨头要想在AI算力芯片上突围,就必须在底座、专利、核心技术、人才建设、生态建设等各方面下大功夫。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6589

    浏览量

    104017
  • 英伟达
    +关注

    关注

    22

    文章

    3767

    浏览量

    90968
  • AI芯片
    +关注

    关注

    17

    文章

    1876

    浏览量

    34975
  • OpenAI
    +关注

    关注

    9

    文章

    1074

    浏览量

    6471
收藏 人收藏

    评论

    相关推荐

    AI大模型不再依赖英伟GPU?苹果揭秘大模型

    ,获得足够的算力构建自己的计算中心,用于训练不同应用的AI模型。 AI领域众星捧月也造就了英伟市值曾突破三万亿美元,并短暂登顶全球第一的位置。不过苹果却反其道而行之,在7月底苹果公司
    的头像 发表于 08-05 06:07 3966次阅读
    <b class='flag-5'>AI</b>大模型不再依赖<b class='flag-5'>英伟</b><b class='flag-5'>达</b>GPU?苹果揭秘<b class='flag-5'>自</b><b class='flag-5'>研</b>大模型

    OpenAI与博通洽谈合作!定制化ASIC芯片走向台前,英伟GPU迎来“劲敌”?

    电子发烧友网报道(文/李弯弯)为了减轻对英伟的依赖,OpenAI一直在推进芯片计划。7月1
    的头像 发表于 07-20 00:02 4864次阅读
    <b class='flag-5'>OpenAI</b>与博通洽谈合作!定制化ASIC<b class='flag-5'>芯片</b>走向台前,<b class='flag-5'>英伟</b><b class='flag-5'>达</b>GPU迎来“劲敌”?

    微软Azure首获英伟GB200 AI服务器

    微软Azure在社交平台上宣布了一项重要进展,公司已经成功获得了搭载英伟最新GB200超级芯片AI服务器。这一举措使
    的头像 发表于 10-10 17:01 517次阅读

    亚马逊AWSAI芯片崛起,挑战英伟

    原话强调道:“在特定情况下,这款芯片的性能表现相较于英伟达产品可以实现高达40%到50%的提升,因此它的制造成本应仅为采用英伟同类产品的一半左右。”
    的头像 发表于 07-27 14:33 1082次阅读

    OpenAI芯片计划调整,传交台积电生产

    近日,全球领先的生成式AI应用大厂OpenAI芯片领域迎来了重大战略调整。为降低对外部AI
    的头像 发表于 07-23 16:52 668次阅读

    华与英伟深化合作,成为NVIDIA AI Enterprise软件全球分销商

    近日,华宣布扩大与英伟的合作,未来将通过工业级边缘计算和英伟 AI Enterprise
    的头像 发表于 05-10 10:25 435次阅读

    微软AI大模型即将问世

    微软正悄然酝酿一项重大技术突破,据内部消息人士透露,公司正全力训练一款名为“MAI-1”的人工智能大模型。这款模型备受期待,其规模庞大,足以与谷歌的Gemini和OpenAI的Ch
    的头像 发表于 05-07 14:46 470次阅读

    英伟首次向OpenAI供应AI服务器,鸿海出货预期将增长

    2017年起,鸿海便开始与英伟合作开发服务器,其中包括世界上首台AI服务器HGX1。值得注意的是,OpenAI成立之初,有一张照片展示了
    的头像 发表于 04-26 16:18 900次阅读

    英伟微软OpenAI纷纷下注人形机器人初创公司FigureAI

    2024年初,机器人领域迎来了一场科技巨头的投资热潮。英伟微软OpenAI和亚马逊创始人贝索斯等重量级玩家纷纷向初创公司FigureA
    的头像 发表于 02-26 11:27 923次阅读

    微软正开发英伟网卡的替代品

    微软公司,全球科技巨头,正在研发一种新型网卡,旨在提升其人工智能芯片Maia的性能,并减少对英伟达产品的依赖。据称,这款新型网卡的设计和
    的头像 发表于 02-21 11:06 804次阅读

    微软正在研发新型网卡,旨在提升AI芯片性能

    微软近日被曝正在秘密研发一款高性能的新型网卡,这一创新旨在增强其的Maia AI服务器芯片的功能,并可能大幅度降低对外部
    的头像 发表于 02-21 11:01 731次阅读

    英伟涉足定制芯片,聚焦云计算与AI市场

     作为全球高端AI芯片市场80%份额的霸主,英伟2023以来股价上涨超过两倍,2024年市值高达1.73万亿美元。知名公司如
    的头像 发表于 02-18 11:08 673次阅读

    英伟注资聊天机器人制造商Kore.ai,进军人工智能市场

    近年来,英伟与新兴人工智能科技公司展开频繁合作,如Hugging Face、Cohere和Mistral AI。其顶级芯片系统在生成式AI
    的头像 发表于 01-31 10:02 634次阅读

    英伟缺货?OpenAI选择芯片

    势在必行。然而掀起这股AI洪流,或者说将其推向浪尖的“始作俑者”,OpenAI,却也已经在计划着芯片。   有了
    的头像 发表于 01-30 00:51 3698次阅读