英特尔新一代AI芯片NNP-L1000明年面世-电子发烧友网

英特尔首届AI 开发者大会发布了一系列机器学习软件工具，并宣布包括其首款商用神经网络处理器产品将于2019年推出。英特尔在旧金山举办第一届AI开发者大会（AI Dev Con），英特尔人工智能负责人Naveen Rao做了开场演讲。

Rao此前是Nervana的CEO和联合创始人，该公司于2016年被英特尔收购。

Naveen Rao

在会上，Rao发布了一系列机器学习软件工具，并宣布英特尔新一代产品，其中包括其首款商用NNP产品NNP-L1000，将于2019年推出。

以下从软件和硬件两个方面介绍AI Dev Con的重点。

MKL-DNN是用于深层神经网络的数学内核库。它是神经网络中常见组件的数学程序列表，包括矩阵乘数、批处理规范、归一化和卷积。该库针对在英特尔CPU上部署模型进行了优化。

nGraph开发者选择不同的AI框架，它们都有各自的优点和缺点。为了使芯片具有灵活性，后端编译器必须能够有效地适应所有的芯片。

nGraph是一个编译器，它可以在英特尔的芯片上运行。开发人员可能想要在英特尔的Xeons处理器上训练他们的模型，然后使用英特尔的神经网络处理器(NNP)进行推理。

BigDL是Apache Spark的另一个库，它的目标是通过分布式学习在深度学习中处理更大的工作负载。应用程序可以用Scala或Python编写，并在Spark集群上执行。

OpenVINOA软件工具包用于处理“边缘”(即摄像头或移动电话)视频的模型。开发人员可以实时地做面部识别的图像分类。它预计将在今年晚些时候开放，但现在可以下载了。

再来看硬件部分。

英特尔在这方面比较沉默，没有透露更多的细节。

“几年前Xeons不适合AI，但现在真的已经改变了。”Rao强调，增加的内存和计算意味着自Haswell芯片以来性能提高了100倍，并且推理的性能提高了近200倍。

“你可能听说过GPU比CPU快100倍。这是错误的。”他补充说，“今天大多数推理都是在Xeons上运行的。”

Rao没有提到Nvidia，他解释说GPU在深度学习方面起了个好头，但受限于严重的内存限制。 Xeon拥有更多的内存，可以扩展到批量大的内存，因此它更适合推理。

在现场，ZIVA CEO James Jacobs还介绍了如何将Xeons用于3D图像渲染。

左边的狮子是没有使用AI，右边的狮子使用了AI，效果很棒。

他也简要地谈到了FPGA加速的问题，并表示英特尔正在研发一种“离散加速器”（discrete accelerator）进行推理，但没有透露更多细节。

同时，还介绍了Intel Movidius的神经计算棒。它是一个U盘，可以运行使用TensorFlow和Caffe编写的模型，耗电量大约一瓦。去年，英特尔公司决定终止其可穿戴设备，如智能手表和健身腕带。

现场还展示了一段用计算棒来进行AI作曲的DEMO，人类演奏者演奏一段曲子，AI能够在这段曲子的基础上进行创作。

英特尔去年宣布神经网络处理器（NNP）芯片。虽然没有发布任何基准测试结果，但英特尔表示将会有可供选择的客户。

Rao也没有透露多少细节。不过，大家所知道的是，它包含12个基于其“Lake Crest”架构的内核，总共拥有32GB内存，在未公开的精度下性能达到40 TFLOPS，理论上的带宽不足800纳秒，在低延迟的互连上，每秒2.4兆的带宽。

最后介绍了NNP L1000，Rao对它的介绍更少，这将是第一个商业NNP模型，并将在2019年推出。它将基于新的Spring Crest体系结构，预计将比之前的Lake Crest模型快3到4倍。

开发者大会的当天，英特尔官网发出一篇Rao的署名文章，对英特尔Nervana神经网络处理器（NNP）进行了介绍。

Nervana NNP有一个明确的设计目标，可实现高计算利用率和支持多芯片互连的真模型并行。

行业里讨论了很多关于最大的理论性能，然而，实际情况是，除非体系结构有能够支持这些计算元素的高利用率的储存器子系统，否则大部分计算都是没有意义的。此外，行业发布的大部分性能数据使用的是大型矩阵，这些矩阵通常在现实世界的神经网络中并不常见。

英特尔专注于为神经网络创建一个平衡的架构，它还包括低延迟的高芯片到芯片带宽。NNP系列的初始性能基准在利用率和互连方面显示出强劲的竞争力。具体包括：

使用A(1536, 2048)和B(2048, 1536)矩阵进行矩阵乘法运算的一般矩阵，在单个芯片上实现了96.4个百分点的计算利用率。这代表了在单个芯片上的实际(非理论)性能的38TOP/s。支持模型并行训练的多芯片分布式GEMM操作实现了A（6144,2048）和B（2048,1536）矩阵大小的接近线性缩放和96.2％的缩放效率，使得多个NNP能够连接在一起，并将我们从其他架构的内存限制中释放出来。

我们测量了89.4 %的单方向芯片到芯片的效率，理论上的带宽小于790ns(纳秒)的延迟，并且将其应用于2.4Tb/s的高带宽、低延迟互连。

所有这些都在单芯片总功率范围内低于210瓦的情况下进行，这只是英特尔Nervana NNP（Lake Crest）原型。

英特尔将在2019年提供第一个商用NNP产品——英特尔Nervana NNP-L1000（Spring Crest）。

预计英特尔Nervana NNP-L1000的性能将达到第一代Lake Crest产品的3-4倍。

在英特尔Nervana NNP-L1000中，还将支持bfloat16，这是一种业界广泛用于神经网络的数字格式。

随着时间的推移，英特尔将在其AI产品线上扩展bfloat16支持，包括英特尔Xeons处理器和英特尔FPGA。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

英特尔

英特尔

+关注

关注
61

文章
9978

浏览量
171889
AI

AI

+关注

关注
87

文章
31000

浏览量
269333
机器学习

机器学习

+关注

关注
66

文章
8422

浏览量
132743

原文标题：超越传统CPU？英特尔新一代AI芯片明年面世

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

英特尔与火山引擎飞连携手升级AI时代企业IT管理体验

在 AI 技术的推动下，企业 IT 管理正经历一场革命。日前，火山引擎飞连新品发布会成功举办。英特尔受邀参与此次活动，并在会上展示了新一代英特尔

发表于 11-14 17:17 •540次阅读

英特尔目标明年出货1亿台AI PC

英特尔近日宣布，其目标是在明年实现1亿台AI PC的出货，相较于2024年4000万台的出货目标，实现了150%的大幅增长。这一雄心勃勃的目标展示了

发表于 10-31 17:07 •323次阅读

英特尔计划明年AI PC出货一亿台

英特尔设定明年AI PC出货目标为一亿台，较2024年原定计划激增150% 　　英特尔销售与营销部总监Jack Huang于10月28日透露，公司计划在

发表于 10-31 14:26 •455次阅读

英特尔调降明年AI服务器芯片出货目标

近日，有消息称英特尔为应对内部策略调整及终端需求变化，已对其旗下AI服务器芯片Gaudi 3的明年出货目标进行了大幅调整。

发表于 10-08 15:38 •283次阅读

AI PC市场爆发，英特尔、高通相继推出新一代AI PC芯片，战况火热升级

针对移动市场推出的第二代产品，也就是其早前展示的Lunar Lake处理器。英特尔表示，首批搭载Ultra 200V芯片的笔记本电脑将在9月24日上线。在整场发布会期间，英特尔反复强调

发表于 09-06 00:16 •3697次阅读

IBM Cloud将部署英特尔Gaudi 3 AI芯片

近日，科技巨头IBM与英特尔宣布了一项重大合作计划，双方将共同在IBM Cloud平台上部署英特尔最新的Gaudi 3 AI芯片，预计该服务

发表于 09-03 15:52 •397次阅读

软银与英特尔AI芯片合作计划告吹

近日，科技界传来消息，软银集团与英特尔公司关于共同开发人工智能（AI）芯片的合作计划以失败告终。据悉，双方曾计划携手生产AI芯片，以挑战英伟

发表于 08-16 17:46 •964次阅读

英特尔发布AI创作应用AI Playground，将于今夏正式上线！

和后续推出的下一代英特尔锐炫独立显卡（代号为Battlemage）产品线。新一代英特尔Xe2 GPU架构可实现50%的性能提升，配备全新光

发表于 06-14 09:44 •491次阅读

英特尔CEO：AI时代英特尔动力不减

英特尔CEO帕特·基辛格坚信，在AI技术的飞速发展之下，英特尔的处理器仍能保持其核心地位。基辛格公开表示，摩尔定律仍然有效，而英特尔在处理器和芯片

发表于 06-06 10:04 •442次阅读

英特尔发布新一代Lunar Lake处理器

在近期举办的中国台北国际电脑展（Computex）上，英特尔CEO盖尔辛格向全球展示了其最新的技术成果。他发布了第六代至强处理器，并重点强调了Gaudi AI加速器的出色性价比。更引人瞩目的是，盖尔辛格还公布了

发表于 06-05 11:23 •948次阅读

英特尔AI产品助力其运行Meta新一代大语言模型Meta Llama 3

英特尔丰富的AI产品——面向数据中心的至强处理器，边缘处理器及AI PC等产品为开发者提供最新的优化，助力其运行Meta新一代大语言模型Meta Llama 3

发表于 04-28 11:16 •645次阅读

英特尔首推面向AI时代的系统级代工—英特尔代工

英特尔首推面向AI时代的系统级代工——英特尔代工（Intel Foundry），在技术、韧性和可持续性方面均处于领先地位。

发表于 02-25 10:38 •560次阅读

银河麒麟与英特尔携手引领新一代私有云平台

近日，银河麒麟云底座操作系统V10与第五代英特尔®至强®可扩展处理器达成强大的技术融合。这一合作不仅为数据中心用户提供了构建新一代私有云平台的理想方案，更是推动了数字化创新的进程。

发表于 02-01 14:34 •930次阅读

英特尔推出汽车版AI芯片，与高通、英伟达展开竞争

在2024年的国际消费电子展（CES）上，英特尔正式发布了一款专为汽车领域设计的人工智能（AI）芯片。这一创新产品标志着

发表于 01-15 15:43 •982次阅读

英特尔宣布进军汽车AI芯片市场

英特尔将发布推出了一系列AI软件定义汽车系统芯片（SDV SoC），在车用芯片市场与高通和英伟达展开竞争。

发表于 01-12 11:33 •901次阅读

搜索历史

英特尔新一代AI芯片NNP-L1000明年面世

评论

英特尔与火山引擎飞连携手升级AI时代企业IT管理体验

英特尔目标明年出货1亿台AI PC

英特尔计划明年AI PC出货一亿台

英特尔调降明年AI服务器芯片出货目标

AI PC市场爆发，英特尔、高通相继推出新一代AI PC芯片，战况火热升级

IBM Cloud将部署英特尔Gaudi 3 AI芯片

软银与英特尔AI芯片合作计划告吹

英特尔发布AI创作应用AI Playground，将于今夏正式上线！

英特尔CEO：AI时代英特尔动力不减

英特尔发布新一代Lunar Lake处理器

英特尔AI产品助力其运行Meta新一代大语言模型Meta Llama 3

英特尔首推面向AI时代的系统级代工—英特尔代工

银河麒麟与英特尔携手引领新一代私有云平台

英特尔推出汽车版AI芯片，与高通、英伟达展开竞争

英特尔宣布进军汽车AI芯片市场