0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔新一代AI芯片NNP-L1000明年面世

DPVg_AI_era 来源:未知 作者:胡薇 2018-05-25 14:23 次阅读

英特尔首届AI开发者大会发布了一系列机器学习软件工具,并宣布包括其首款商用神经网络处理器产品将于2019年推出。英特尔在旧金山举办第一届AI开发者大会(AI Dev Con),英特尔人工智能负责人Naveen Rao做了开场演讲。

Rao此前是Nervana的CEO和联合创始人,该公司于2016年被英特尔收购。

Naveen Rao

在会上,Rao发布了一系列机器学习软件工具,并宣布英特尔新一代产品,其中包括其首款商用NNP产品NNP-L1000,将于2019年推出。

以下从软件和硬件两个方面介绍AI Dev Con的重点。

MKL-DNN是用于深层神经网络的数学内核库。它是神经网络中常见组件的数学程序列表,包括矩阵乘数、批处理规范、归一化和卷积。该库针对在英特尔CPU上部署模型进行了优化。

nGraph开发者选择不同的AI框架,它们都有各自的优点和缺点。为了使芯片具有灵活性,后端编译器必须能够有效地适应所有的芯片。

nGraph是一个编译器,它可以在英特尔的芯片上运行。开发人员可能想要在英特尔的Xeons处理器上训练他们的模型,然后使用英特尔的神经网络处理器(NNP)进行推理。

BigDL是Apache Spark的另一个库,它的目标是通过分布式学习在深度学习中处理更大的工作负载。应用程序可以用Scala或Python编写,并在Spark集群上执行。

OpenVINOA软件工具包用于处理“边缘”(即摄像头或移动电话)视频的模型。开发人员可以实时地做面部识别的图像分类。它预计将在今年晚些时候开放,但现在可以下载了。

再来看硬件部分。

英特尔在这方面比较沉默,没有透露更多的细节。

“几年前Xeons不适合AI,但现在真的已经改变了。”Rao强调,增加的内存和计算意味着自Haswell芯片以来性能提高了100倍,并且推理的性能提高了近200倍。

“你可能听说过GPU比CPU快100倍。这是错误的。”他补充说,“今天大多数推理都是在Xeons上运行的。”

Rao没有提到Nvidia,他解释说GPU在深度学习方面起了个好头,但受限于严重的内存限制。 Xeon拥有更多的内存,可以扩展到批量大的内存,因此它更适合推理。

在现场,ZIVA CEO James Jacobs还介绍了如何将Xeons用于3D图像渲染。

左边的狮子是没有使用AI,右边的狮子使用了AI,效果很棒。

他也简要地谈到了FPGA加速的问题,并表示英特尔正在研发一种“离散加速器”(discrete accelerator)进行推理,但没有透露更多细节。

同时,还介绍了Intel Movidius的神经计算棒。它是一个U盘,可以运行使用TensorFlow和Caffe编写的模型,耗电量大约一瓦。去年,英特尔公司决定终止其可穿戴设备,如智能手表和健身腕带。

现场还展示了一段用计算棒来进行AI作曲的DEMO,人类演奏者演奏一段曲子,AI能够在这段曲子的基础上进行创作。

英特尔去年宣布神经网络处理器(NNP)芯片。虽然没有发布任何基准测试结果,但英特尔表示将会有可供选择的客户。

Rao也没有透露多少细节。不过,大家所知道的是,它包含12个基于其“Lake Crest”架构的内核,总共拥有32GB内存,在未公开的精度下性能达到40 TFLOPS,理论上的带宽不足800纳秒,在低延迟的互连上,每秒2.4兆的带宽。

最后介绍了NNP L1000,Rao对它的介绍更少,这将是第一个商业NNP模型,并将在2019年推出。它将基于新的Spring Crest体系结构,预计将比之前的Lake Crest模型快3到4倍。

开发者大会的当天,英特尔官网发出一篇Rao的署名文章,对英特尔Nervana神经网络处理器(NNP)进行了介绍。

Nervana NNP有一个明确的设计目标,可实现高计算利用率和支持多芯片互连的真模型并行。

行业里讨论了很多关于最大的理论性能,然而,实际情况是,除非体系结构有能够支持这些计算元素的高利用率的储存器子系统,否则大部分计算都是没有意义的。此外,行业发布的大部分性能数据使用的是大型矩阵,这些矩阵通常在现实世界的神经网络中并不常见。

英特尔专注于为神经网络创建一个平衡的架构,它还包括低延迟的高芯片到芯片带宽。NNP系列的初始性能基准在利用率和互连方面显示出强劲的竞争力。具体包括:

使用A(1536, 2048)和B(2048, 1536)矩阵进行矩阵乘法运算的一般矩阵,在单个芯片上实现了96.4个百分点的计算利用率。这代表了在单个芯片上的实际(非理论)性能的38TOP/s。支持模型并行训练的多芯片分布式GEMM操作实现了A(6144,2048)和B(2048,1536)矩阵大小的接近线性缩放和96.2%的缩放效率,使得多个NNP能够连接在一起,并将我们从其他架构的内存限制中释放出来。

我们测量了89.4 %的单方向芯片到芯片的效率,理论上的带宽小于790ns(纳秒)的延迟,并且将其应用于2.4Tb/s的高带宽、低延迟互连。

所有这些都在单芯片总功率范围内低于210瓦的情况下进行,这只是英特尔Nervana NNP(Lake Crest)原型。

英特尔将在2019年提供第一个商用NNP产品——英特尔Nervana NNP-L1000(Spring Crest)。

预计英特尔Nervana NNP-L1000的性能将达到第一代Lake Crest产品的3-4倍。

在英特尔Nervana NNP-L1000中,还将支持bfloat16,这是一种业界广泛用于神经网络的数字格式。

随着时间的推移,英特尔将在其AI产品线上扩展bfloat16支持,包括英特尔Xeons处理器和英特尔FPGA。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    60

    文章

    9886

    浏览量

    171528
  • AI
    AI
    +关注

    关注

    87

    文章

    30146

    浏览量

    268421
  • 机器学习
    +关注

    关注

    66

    文章

    8377

    浏览量

    132410

原文标题:超越传统CPU?英特尔新一代AI芯片明年面世

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    英特尔与火山引擎飞连携手升级AI时代企业IT管理体验

    AI 技术的推动下,企业 IT 管理正经历场革命。日前,火山引擎飞连新品发布会成功举办。英特尔受邀参与此次活动,并在会上展示了新一代英特尔
    的头像 发表于 11-14 17:17 451次阅读

    英特尔目标明年出货1亿台AI PC

    英特尔近日宣布,其目标是在明年实现1亿台AI PC的出货,相较于2024年4000万台的出货目标,实现了150%的大幅增长。这雄心勃勃的目标展示了
    的头像 发表于 10-31 17:07 264次阅读

    英特尔计划明年AI PC出货一亿台

    英特尔设定明年AI PC出货目标为一亿台,较2024年原定计划激增150%   英特尔销售与营销部总监Jack Huang于10月28日透露,公司计划在
    的头像 发表于 10-31 14:26 340次阅读

    英特尔调降明年AI服务器芯片出货目标

    近日,有消息称英特尔为应对内部策略调整及终端需求变化,已对其旗下AI服务器芯片Gaudi 3的明年出货目标进行了大幅调整。
    的头像 发表于 10-08 15:38 233次阅读

    AI PC市场爆发,英特尔、高通相继推出新一代AI PC芯片,战况火热升级

    针对移动市场推出的第二产品,也就是其早前展示的Lunar Lake处理器。英特尔表示,首批搭载Ultra 200V芯片的笔记本电脑将在9月24日上线。在整场发布会期间,英特尔反复强调
    的头像 发表于 09-06 00:16 3546次阅读

    软银与英特尔AI芯片合作计划告吹

    近日,科技界传来消息,软银集团与英特尔公司关于共同开发人工智能(AI芯片的合作计划以失败告终。据悉,双方曾计划携手生产AI芯片,以挑战英伟
    的头像 发表于 08-16 17:46 906次阅读

    英特尔发布AI创作应用AI Playground,将于今夏正式上线!

    和后续推出的下一代英特尔锐炫独立显卡(代号为Battlemage)产品线。新一代英特尔Xe2 GPU架构可实现50%的性能提升,配备全新光
    的头像 发表于 06-14 09:44 425次阅读
    <b class='flag-5'>英特尔</b>发布<b class='flag-5'>AI</b>创作应用<b class='flag-5'>AI</b> Playground,将于今夏正式上线!

    英特尔CEO:AI时代英特尔动力不减

    英特尔CEO帕特·基辛格坚信,在AI技术的飞速发展之下,英特尔的处理器仍能保持其核心地位。基辛格公开表示,摩尔定律仍然有效,而英特尔在处理器和芯片
    的头像 发表于 06-06 10:04 381次阅读

    英特尔发布新一代Lunar Lake处理器

    在近期举办的中国台北国际电脑展(Computex)上,英特尔CEO盖尔辛格向全球展示了其最新的技术成果。他发布了第六至强处理器,并重点强调了Gaudi AI加速器的出色性价比。更引人瞩目的是,盖尔辛格还公布了
    的头像 发表于 06-05 11:23 878次阅读

    英特尔AI产品助力其运行Meta新一代大语言模型Meta Llama 3

    英特尔丰富的AI产品——面向数据中心的至强处理器,边缘处理器及AI PC等产品为开发者提供最新的优化,助力其运行Meta新一代大语言模型Meta Llama 3
    的头像 发表于 04-28 11:16 583次阅读

    银河麒麟与英特尔携手引领新一代私有云平台

    近日,银河麒麟云底座操作系统V10与第五英特尔®至强®可扩展处理器达成强大的技术融合。这合作不仅为数据中心用户提供了构建新一代私有云平台的理想方案,更是推动了数字化创新的进程。
    的头像 发表于 02-01 14:34 863次阅读

    英特尔宣布进军汽车AI芯片市场

    英特尔将发布推出了系列AI软件定义汽车系统芯片(SDV SoC),在车用芯片市场与高通和英伟达展开竞争。
    的头像 发表于 01-12 11:33 832次阅读

    英特尔推出新一代强大产品, 加速实现 “AI 无处不在 ”

    英特尔® 酷睿™ Ultra 和第五英特尔® 至强® 可扩展处理器丰富了英特尔出色的AI产品组合,加速
    发表于 12-16 16:27 428次阅读
    <b class='flag-5'>英特尔</b>推出<b class='flag-5'>新一代</b>强大产品, 加速实现 “<b class='flag-5'>AI</b> 无处不在 ”

    AI 无处不在,英特尔酷睿Ultra 和第五英特尔至强可扩展处理器正式发布

    英特尔  酷睿 Ultra处理器和第五英特尔   至强   可扩展处理器支持的AI产品亮相,展现了英特尔从云到端全方位的
    的头像 发表于 12-16 16:05 682次阅读
    <b class='flag-5'>AI</b> 无处不在,<b class='flag-5'>英特尔</b>酷睿Ultra 和第五<b class='flag-5'>代</b><b class='flag-5'>英特尔</b>至强可扩展处理器正式发布

    英特尔发布新一代移动端处理器——酷睿Ultra系列

     在12月7日的联想集团“AI PC 产业创新论坛”上,英特尔中国区技术总经理高宇透露,新一代酷睿 Ultra 处理器已经适配了超过10款中国大型模型。
    的头像 发表于 12-14 17:14 1776次阅读