0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔推出AI加速器性价比产品Gaudi2

IT葡萄皮 来源:IT葡萄皮 2023-07-14 16:42 次阅读

日前,英特尔面向中国市场发布了HabanaGaudi2深度学习加速卡器。

新的Gaudi2直接给到了24个Tensor处理核心(TPC),是上代产品的三倍;而在对大模型应用至关重要的显存方面,Gaudi2也大方的配置了96GBHBM2e,显存带宽直接达到了2.4TB/s。而在连接方式上,Gaudi2则采用了OCPOAM接口形式,可扩展出21个100G以太网连接,并支持RoCE(RDMAover Converged Ethernet)v2。同时,Gaudi2还集成了多媒体处理器引擎和48MB片上SRAM作为高速缓存。

在系统层面,英特尔则提供能够同时安装8块Gaudi2的夹层基板,同样遵循OCP标准,可扩展出24个100GRoCE网络接口。

性能更好的新选择

Gaudi2搭载的96GBHBM显存的确令人眼前一亮,但真正能够影响用户购买行为的仍旧似乎加速卡本身的计算性能。

在HuggingFace工程师RégisPierrard去年底进行的Gaudi2测试中,Gaudi2不仅在与前代产品的对比中表现出了近乎线性的性能提升,更大幅超越了对标的A100加速卡。

5261f29a-2220-11ee-962d-dac502259ad0.png

BERT预训练,8卡

Gaudi2使用bf16/fp32混合精度,A100使用fp16精度

526f3b26-2220-11ee-962d-dac502259ad0.png

StableDiffusion测试,单卡

从RégisPierrard使用IntelDeveloper Cloud进行的两轮测试中我们不难发现,无论是在BERT这样的大模型应用中,还是在StableDiffusion这样的“传统”AIGC应用中,Gaudi2的性能表现均相当亮眼;相对于前代产品展现出了至少3倍的性能优势(Gaudi2的TPC数量是前代的3倍),且比对标的A100产品更具性能优势。

在两项测试中,Gaudi2均使用了英特尔推出的SynapseAI1.10套件和OptimumHabana1.6;其中前者是面向Gaudi系列加速卡的SDK开发套件,能够对TensorFlow和Pytorch等流行框架提供支持,而后者则是专门面向Transformers和Diffusers优化的运行库。

同时,在发布会的现场演示环节,英特尔工作人员展示了StableDiffusion应用中1至64张卡的计算性能,并实现了99%的近线性性能扩展。换而言之,在更大规模的业务部署当中,Gaudi2也能通过集群横向扩展获得更加线性的性能增长。

目前,Gaudi系列AI加速器已经在AWS的EC2DL1主机中进行了实际的商业部署。AWS表示,相对于传统GPU,Gaudi能够在深度学习应用中带来40%的性价比提升。

在走量的市场做走心的产品

诚然,Gaudi2的竞品并非性能无两的H100,更无法对即将面市的H100NVL构成性能威胁。但对于更加“走量”的A100而言,Gaudi2所展现出的性价比则对大多数用户而言更有价值。

近两年,“从中端入局”似乎已经成为英特尔的惯用手段,消费级的Arc770显卡和如今的Gaudi2均如此。

走量的中端市场对英特尔有足够的吸引力,也更容易帮助英特尔用一两款产品就建立口碑、站稳脚跟;同时,能在中端市场为用户提供先进技术和优势性价比也证明英特尔对目标用户足够走心,愿意把真正的实惠带给最广阔的用户市场。

在走量的市场做走心的产品,这样的英特尔令人喜闻乐见。

为Ai加速器市场打开一扇窗

近两年,以AIGC为代表的AI应用快速崛起,吸引了科技圈和投资界的广泛关注,其中的语言类大模型更有望大幅降低企业在营销、客服和售后方面的成本,实现生产效率的大幅提升。

在科技企业争相进行大模型“军备竞赛”的背后,GPU的需求也水涨船高。在GPU市场格局高度固化的当下,这一现象很容易带来终端市场的价格起伏,导致GPU价格畸高,进而推高企业投身AI业务的成本并导致基础架构被绑定。

而英特尔Gaudi2加速卡的出现则意味着企业有了全新选择。一方面,Gaudi2在绝对性能、显存容量、集群性能等方面都比对标产品有优势,能够承接现有的市场需求;另一方面,伴随oneAPI等算力调用工具的不断成熟和完善,用户也能在开发和应用层面实现基础架构的透明化,更轻松的调用多元算力,继而获得算力和基础架构层面的灵活性。

528258aa-2220-11ee-962d-dac502259ad0.png

作为AI加速器市场的“追赶者”,Gaudi2证明英特尔能够为用户提供有竞争力的先进产品。当然,这还仅是在“独立AI加速器”这一条赛道中。

在更广阔的数据中心赛道中,英特尔还有并行的DataCenter Max和DataCenterFlex两条产品线,以及更加独立的FPGA赛道。此外,英特尔也在积极推动AI能力与传统CPU的结合。从最初的AVX-512指令集和DLBoost到如今AMX-512指令集,英特尔正在为用户构建一条“用CPU灵活处理AI推理业务”的全新路径。

很显然,在英特尔的眼中,用户在未来应该针对不同场景和不同业务负载来规划不同的基础架构,用不同算力来满足业务需求。而伴随oneAPI的逐步成熟,底层算力的区别将被抹除,模型训练和多端部署不再需要特别调优就能实现无缝迁移和高效调优。

在产品层面,英特尔最新推出的Gaudi2对用户而言有足够的吸引力;在战略层面,Gaud2则是英特尔站稳独立AI加速器市场并构筑多元算力体系的重要一步。而在AI研究快速推进,技术落地如火如荼的当下,Gaudi2的出现无疑为用户带来了全新选择;而奋力前行的英特尔更有望为市场带来AI与算力需求之间的全新平衡。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    60

    文章

    9880

    浏览量

    171450
  • 加速器
    +关注

    关注

    2

    文章

    795

    浏览量

    37750
  • AI
    AI
    +关注

    关注

    87

    文章

    30103

    浏览量

    268386
  • Gaudi2
    +关注

    关注

    0

    文章

    13

    浏览量

    98

原文标题:先得走心,才能走量!英特尔推出AI加速器性价比产品Gaudi2

文章出处:【微信号:IT葡萄皮,微信公众号:IT葡萄皮】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Inflection AI转向英特尔Gaudi 3,放弃英伟达GPU

    近日,人工智能技术公司Inflection AI宣布了一项重要决策,其最新的企业平台将放弃采用英伟达(Nvidia)的GPU,转而选择英特尔Gaudi 3加速器
    的头像 发表于 10-10 17:21 438次阅读

    Inflection AI携手英特尔推出企业级AI系统

    近日,AI初创企业Inflection AI英特尔联合宣布了一项重大合作——推出基于英特尔Gaudi
    的头像 发表于 10-09 16:40 382次阅读

    英特尔发布Gaudi3 AI加速器,押注低成本优势挑战市场

    英特尔近期震撼发布了专为AI工作负载设计的Gaudi3加速器,这款新芯片虽在速度上不及英伟达热门型号H100与H200 GPU,但英特尔巧妙
    的头像 发表于 09-26 16:16 763次阅读

    IBM Cloud将部署英特尔Gaudi 3 AI芯片

    近日,科技巨头IBM与英特尔宣布了一项重大合作计划,双方将共同在IBM Cloud平台上部署英特尔最新的Gaudi 3 AI芯片,预计该服务将于2025年初正式上线。此次合作标志着两家
    的头像 发表于 09-03 15:52 354次阅读

    从运动员到开发者: 英特尔以开放式AI系统应对多重挑战

    打造的生成式AI(GenAI)检索增强生成(RAG)解决方案。该成果深度展示了英特尔如何通过基于英特尔®至强®处理英特尔® 
    的头像 发表于 07-25 09:28 249次阅读
    从运动员到开发者: <b class='flag-5'>英特尔</b>以开放式<b class='flag-5'>AI</b>系统应对多重挑战

    英特尔发布新一代Lunar Lake处理

    在近期举办的中国台北国际电脑展(Computex)上,英特尔CEO盖尔辛格向全球展示了其最新的技术成果。他发布了第六代至强处理,并重点强调了Gaudi AI
    的头像 发表于 06-05 11:23 877次阅读

    英特尔确认Ponte Vecchio GPU将以云服务形式推出

    英特尔在公告中强调,随着AI技术需求的不断增加,公司重点利用Gaudi AI加速器的性能优势及有竞争力的价格,实现其迅速拓展。同时,至强系列
    的头像 发表于 05-18 17:14 1021次阅读

    英特尔推出中国市场“特供版芯片”Gaudi 3

    英特尔计划在中国市场推出“特供版”Gaudi 3 AI芯片,这一决策主要是基于美国对于AI芯片的出口管制政策。
    的头像 发表于 04-16 14:48 531次阅读

    英特尔公布Gaudi 3 AI加速器中国特供版计划

    这两款专供版加速卡,分别被命名为HL-328和HL-388,它们代表了英特尔AI加速领域的最新技术成果。
    的头像 发表于 04-15 15:19 695次阅读

    Intel Vision 2024大会: 英特尔发布全新软硬件平台,全速助力企业推进AI创新

    的下一代英特尔®至强®6处理的全新品牌。 •推出英特尔®Gaudi 3 AI
    的头像 发表于 04-12 14:52 491次阅读
    Intel Vision 2024大会: <b class='flag-5'>英特尔</b>发布全新软硬件平台,全速助力企业推进<b class='flag-5'>AI</b>创新

    英特尔进军AI芯片市场:推出Gaudi 3 AI加速卡与Xeon 6处理

    Gaudi 3作为英特尔AI领域的最新力作,旨在与英伟达等市场领导者展开竞争。据英特尔透露,这款芯片在能效和AI模型运行速度方面均表现出色
    的头像 发表于 04-10 15:37 756次阅读

    英特尔专家为您揭秘第五代英特尔® 至强® 可扩展处理如何为AI加速

    % 1 ,AI 推理性能提升42% 2 。 这一系列性能提升的背后,存在着怎样的创新与突破?第五代英特尔 至强 可扩展处理为什么要强调为AI
    的头像 发表于 12-23 12:20 705次阅读

    英特尔Gaudi2C处理或为Gaudi2的简化版,Gaudi3预计2024年面世

    对于Gaudi2C和Gaudi2之间的差别,有推测认为它可能是“部分”改动后的产品,针对中国市场专门定制。Tomshardware则猜测可能是Gaudi2的简化版。
    的头像 发表于 12-20 13:44 1086次阅读

    英特尔推出新一代强大产品加速实现 “AI 无处不在 ”

    英特尔® 酷睿™ Ultra 和第五代英特尔® 至强® 可扩展处理丰富了英特尔出色的AI产品
    发表于 12-16 16:27 427次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>推出</b>新一代强大<b class='flag-5'>产品</b>, <b class='flag-5'>加速</b>实现 “<b class='flag-5'>AI</b> 无处不在 ”

    英特尔Gaudi 3系列AI加速器明年上市

    英特尔总裁帕特·基辛格(Pat Gelsinger)认为,鉴于英特尔Gaudi3具备的持续加强的性能优势和极具竞争性的TCO及定价机制,预测该产品有望在2024年凭借领先的
    的头像 发表于 12-15 11:07 770次阅读