0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔推云端AI芯片 拟联手国内厂商开发AI服务器

科创板日报 来源:科创板日报 2023-07-13 11:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

英特尔在中国推出云端AI训练芯片Habana Gaudi2,该芯片可满足大规模语言模型、多模态模型及生成式AI模型的需求。

7月11日,英特尔在中国市场推出云端AI训练芯片——Habana Gaudi2。该芯片可满足大规模语言模型、多模态模型及生成式AI模型的需求。据现场介绍,该芯片性能在一些关键指标上胜过英伟达A100。

据了解,该Gaudi2处理器及Gaudi2夹层卡HL-225B,以第一代Gaudi高性能架构为基础,具有24个可编程Tensor处理器核心(TPCs)。

每颗芯片集成了21个专用于内部互联的100Gbps(RoCEv2 RDMA以太网接口,配备配置96GB HBM高速内存及2.4TB/秒的总内存带宽,满足大规模语言模型、多模态模型及生成式AI模型的需求。

据现场介绍,英特尔Gaudi2运行ResNet-50的每瓦性能约是英伟达A100的2倍,运行1760亿参数BLOOMZ模型的每瓦性能约达A100的1.6倍。

在发布会上,浪潮信息高级副总裁、AI和HPC总经理刘军现场发布搭载Gaudi2的新一代AI服务器NF5698G7。

目前,英特尔已与浪潮信息合作,打造基于Gaudi2深度学习加速器的AI服务器NF5698G7。该服务器集成了8颗Gaudi2加速卡HL-225B,还包含双路第四代英特尔至强可扩展处理器,支持AMX/DSA等AI加速引擎。当日,该款AI服务器也正式发布。

浪潮信息高级产品经理王磊强调,NF5698G7是专为面向生成式AI市场开发的新一代AI服务器,支持8颗OAM高速互联的Gaudi2加速器,将为AI客户提供大模型训练和推理能力。

新华三集团计算存储产品线副总裁刘宏程表示,基于英特尔Gaudi2 AI加速器,新华三正与英特尔合作,开发适合大模型训练和推理的高性能AI服务器。

同时,超聚变数字技术有限公司算力基础设施领域总裁唐启明指出,超聚变将与英特尔,共同推出基于Gaudi2的全新产品与解决方案。

此前,英特尔中国区董事长王锐在接受《科创板日报》记者采访时指出,ChatGPT浪潮带来计算需求的大幅度提升,目前正与包括百度、阿里等在内的中国的客户开展共同研究。王锐透露,不管是高性能的计算还是分布式的计算,都已经进行了布局。

一位英特尔技术专家《科创板日报》记者分享了英特尔在大模型领域的布局情况。在训练层面,针对CPUGPU、IPU、Habana等异构计算,英特尔用oneAPI以及XPU平台来提供更多的选择。在推理方面,第四代Sapphire Rapids发布后,基于AMX加速器,可在行业中解决80%以上的客户推理需求。同时,也充分利用CPU,包括用于训练的Ponte Vecchio,和用于推理的Arctic Sound等。

伴随着大模型的热潮,云计算的商业模式正朝着MaaS(模型即服务)的方向演进,其所带来的算力需求也值得关注。

“它的理念是利用预训练模型,对行业数据进行训练,从而形成针对特定场景的、面向各行业的细分模型。我们知道通用模型的参数量非常大,例如GPT-3可达到1750亿,部署这些模型会比较麻烦,因此,可能需要对大模型进行蒸馏和压缩,形成行业可部署的模型。”上述技术专家称。

此外,把大模型进行私有化部署是不少行业的潜在需求。“很多细分行业不接受SaaS服务,尤其金融等行业。因此,英特尔正在探讨如何把这个模型小型化之后,在本土落地做私有化部署,使其真正在行业落地。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10326

    浏览量

    181147
  • 云计算
    +关注

    关注

    39

    文章

    8045

    浏览量

    144819
  • AI芯片
    +关注

    关注

    17

    文章

    2166

    浏览量

    36869
  • 大模型
    +关注

    关注

    2

    文章

    3797

    浏览量

    5280

原文标题:欲与英伟达决高下?英特尔推云端AI芯片 拟联手国内厂商开发AI服务器

文章出处:【微信号:chinastarmarket,微信公众号:科创板日报】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI工作站本地养龙虾!英特尔双芯混合算力,告别云端Token焦虑

    4月23日,英特尔公司在北京举办新一代AI工作站平台发布会,英特尔中国区技术部总经理高宇宣布,面向AI工作站,英特尔推出两大重磅产品:
    的头像 发表于 04-26 16:27 1.1w次阅读
    <b class='flag-5'>AI</b>工作站本地养龙虾!<b class='flag-5'>英特尔</b>双芯混合算力,告别<b class='flag-5'>云端</b>Token焦虑

    英特尔“智能体PC”登场:AI硬件革命迈入混合架构新纪元

    近日,在AI技术从云端向终端加速渗透的转折点上,英特尔在北京举办的混合AI部署方案分享会上抛出一枚重磅炸弹——正式提出“智能体PC”概念。这一被定义为“
    的头像 发表于 04-22 10:36 576次阅读

    英特尔与华阳通用联手推出全新AI Box解决方案

    英特尔宣布推出基于最新英特尔 酷睿 Ultra 架构的AI Box解决方案,将PC级旗舰算力引入汽车、工业自动化、轨道交通、机器人等多种工业环境,为各行各业接入AI大模型提供高效灵活的
    的头像 发表于 03-02 14:15 791次阅读

    英特尔开发者年度盛会智潮涌动,推动AI创新走向产业纵深

    2026年1月16日,上海 ——2025英特尔AI开发者优秀项目路演暨英特尔平台企业AI解决方案创新实践赛颁奖大会成功举办,Bluedot团
    的头像 发表于 01-19 16:14 522次阅读

    全球首款落地!英特尔携手新华三等合作伙伴,重磅推出全域液冷服务器

    11月19日,英特尔携手本地生态伙伴——新华三、英维克、忆联及国内领先内存厂商,发布了基于英特尔至强6900系列性能核处理的双路冷板式全域
    的头像 发表于 11-25 09:17 1.1w次阅读
    全球首款落地!<b class='flag-5'>英特尔</b>携手新华三等合作伙伴,重磅推出全域液冷<b class='flag-5'>服务器</b>

    打造智算基石:英特尔携手本土生态发布全域液冷服务器

    2025年11月19日,重庆 ——在英特尔技术创新与产业生态大会上,英特尔携手本地生态伙伴——新华三、英维克、忆联及国内领先内存厂商,发布了基于英特
    的头像 发表于 11-20 14:31 590次阅读
    打造智算基石:<b class='flag-5'>英特尔</b>携手本土生态发布全域液冷<b class='flag-5'>服务器</b>

    对话|AI服务器电源对磁性元件提出的新需求

    编者按: 自ChatGPT、DeepSeek等大型AI模型应用爆发以来,市场对AI服务器的需求激增,其配套电源的发展前景已成为行业共识。目前,I服务器电源企业的出货规模仍有限,
    的头像 发表于 10-11 14:55 1303次阅读
    对话|<b class='flag-5'>AI</b><b class='flag-5'>服务器</b>电源对磁性元件提出的新需求

    从云到端:英特尔展示全栈AI能力,覆盖云、边、PC多场景

    2025年9月25日,杭州——今日,在2025云栖大会上,英特尔与阿里云带来了多项云基础设施创新成果,包括兼容多代际服务器(支持第五代英特尔® 至强® 可扩展处理和最新至强® 6处理
    的头像 发表于 09-26 17:27 1791次阅读
    从云到端:<b class='flag-5'>英特尔</b>展示全栈<b class='flag-5'>AI</b>能力,覆盖云、边、PC多场景

    4450亿美元!Edge AI市场大爆发,英特尔布局哪些AI SoC芯片

    AI是边缘计算和IoT增长的最大驱动力,预计到2030年,AI将成为全球边缘市场的重要驱动力,市场规模有望达到4450亿美元。英特尔在边缘AI领域布局哪些
    的头像 发表于 08-04 08:46 7462次阅读
    4450亿美元!Edge <b class='flag-5'>AI</b>市场大爆发,<b class='flag-5'>英特尔</b>布局哪些<b class='flag-5'>AI</b> SoC<b class='flag-5'>芯片</b>?

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    有什么特殊之处呢? AI加速系统为何看重CPU主控能力? 作为造价极高的AI加速系统,DGX B300可以不计成本地选任何CPU,只要它能充分的发挥整套系统的性能。选择英特尔至强6作为默认推荐的CPU配置,这意味着它能很好地满足
    的头像 发表于 06-27 11:44 1062次阅读
    主控CPU全能选手,<b class='flag-5'>英特尔</b>至强6助力<b class='flag-5'>AI</b>系统高效运转

    英特尔发布边缘AI控制与边缘智算一体机,创造“AI新视界”

    处理的边缘 AI 控制 和 基于英特尔锐炫 ™ 显卡的边缘智算一体机 ,为工业AI的规模化落地注入强劲动力。
    发表于 06-24 17:50 1583次阅读
    <b class='flag-5'>英特尔</b>发布边缘<b class='flag-5'>AI</b>控制<b class='flag-5'>器</b>与边缘智算一体机,创造“<b class='flag-5'>AI</b>新视界”

    英特尔锐炫Pro B系列,边缘AI的“智能引擎”

    CTO、高级首席AI工程师张宇博士 英特尔客户端计算事业部边缘计算CTO、高级首席AI工程师张宇博士在MWC AI终端峰会上指出,边缘将崛起为AI
    的头像 发表于 06-20 17:32 1083次阅读
    <b class='flag-5'>英特尔</b>锐炫Pro B系列,边缘<b class='flag-5'>AI</b>的“智能引擎”

    直击Computex 2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    电子发烧友原创  章鹰 5月19日,在Computex 2025上,英特尔发布了最新全新图形处理(GPU)和AI加速产品系列。包括全新英特尔
    的头像 发表于 05-21 00:57 7804次阅读
    直击Computex 2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    直击Computex2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理(GPU)和AI加速产品系列。包括全新英特尔锐炫™ Pro B系
    的头像 发表于 05-20 12:27 5714次阅读
    直击Computex2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    英特尔发布全新GPU,AI和工作站迎来新选择

    英特尔推出面向准专业用户和AI开发者的英特尔锐炫Pro GPU系列,发布英特尔® Gaudi 3 AI
    发表于 05-20 11:03 1931次阅读