“AI芯片0.5与2.0”还有这区别？-电子发烧友网

我从2017年的ISSCC开始写AI硬件相关的文章，到现在刚好两年了。在刚刚过去的ISSCC2019上，AI芯片仍然是一个热点，有几个session都和AI硬件相关。同时，CGO19会议的Compilers for Machine Learning Workshop，各种ML编译器纷纷出场。从大环境来看，第一代AI芯片软硬件技术基本成熟，产业格局逐渐稳定，已经为规模应用做好了准备，可称之为AI芯片0.5版本。而在ISSCC会议上，大神Yann LeCun在讲演中提出了对未来AI芯片的需求[1]，开启了我们对新的架构（AI芯片2.0）的思考。

ISSCC2019

两年前，我在公众号发文分析了ISSCC2017Deep-Learning Processors Session中的7篇文章。到今天，不仅AI芯片技术取得了长足的进步，大家写文章的热情也越来越高，相信后面会看到各种对ISSCC2019论文进行分析的文章。所以，我就不再单独讨论具体的论文了，只谈一些综合的感受。

这次我看到论文摘要的时候，首先是还是看Session 7和14的Machine Learning部分。而我最关注的是三星的论文“An11.5TOPS/W 1024-MAC Butte rfly Structure Dual-Core Sparsity-Aware Neural Processing Unit in 8nm Flagship Mobile SoC”。大家知道，三星在手机芯片中加入NPU是相对较晚的，应该说在设计中吸收了学界和业界这几年AI芯片研发的经验。另外，这也是业界首次公开在规模量产芯片（旗舰手机芯片）中的NPU细节，一方面反映了“真实”和“实用”（不追求指标惊人，而是有更明确的优化目标）的结果，另一方面也标志着整个产业对NPU设计的认识已经比较成熟。

另外一个重要看点当然是Yann LeCun教授的演讲。ISSCC本来是半导体产业中的“电路（circuit）”会议，这几年越来越多的加入架构层面的内容。这次请AI大神做Keynote就更有意思了。大神在ISSCC讲演的几天之内还做了一波PR，也有宣传Facebook自研芯片的意思。当然，大神的演讲还是非常棒的，特别是对新架构的分析。这几天已经有很多文章介绍这个研究，我这里只贴一下他分享的的AI硬件相关的经验教训以及对未来的展望。

source：ISSCC2019

前两个部分反映了上世纪90年底开始到今天的AI热潮中AI硬件的尝试以及整个AI发展中我们学习到的经验和教训。第三部分是对新架构的预测，这个我将在本文第三部分重点讨论。第四部分主要讲一些算法的趋势，特别是Self-Supervised Learning（蛋糕上的樱桃）。

最后，他还分享了一下自己的一些其它思考，特别是对于SNN的质疑。这部分内容这两天也引起很大争议。SNN现在确实面临实用性的问题，Neuromorphic的初衷是模仿人脑，但由于我们现在使用的模型太简单，这种模型和算法是否是正确路径确实还有疑问。第二部分，他对模拟计算也有一些疑问，看起来也都是老问题。我自己没有参会，所以不太清楚他具体的讲法是什么。不过我个人觉得模拟计算还是很有前途的（或者说是不得不走的路）。

source：ISSCC2019

如果说Yann LeCun教授对AI芯片的新架构提出了需求，那么另外一个推动AI芯片技术进步的要素将是底层半导体技术的进步，这也正是ISSCC的重点。从这次会议来看，存储技术(包括存内计算），模拟计算，硅光技术等等，在AI，5G等需求的驱动下都非常活跃。这些技术和AI芯片的关系之前都有介绍，本文就不赘述了。

Compilers for Machine Learning

就在ISSCC的同时，“The International Symposium on Code Generation and Optimization (CGO)”上的“Compilers for Machine Learning” workshop[2]也相当热闹。我们不妨先看看讨论的内容：

会议除了目前三大AI/ML编译器XLA(Tensorflow)，TVM，Glow(Pytorch)之外；还有Intel的nGraph，PlaidML；Nvidia的TensorRT；Xilinx用于ACAP的编译器。另外还有大神Chris的talk和其它来自学界的讲演。会议大部分Slides在网上都可以看到，这里就不具体介绍了。我在一年前写过一篇文章“Deep Learning的IR“之争””，主要讨论IR的问题，和编译器也是密切相关的。到今天，这个领域确实也是现在大家竞争的一个焦点。

XLA是比较早提编译器概念的，但到现在主要还是针对Google的TPU进行优化。TVM相当活跃，前一段时间还搞了TVM conference，除了东家Amazon之外，华为，Intel，Xilinx，甚至“竞争对手” Facebook都有参加。TVM的“野心”也很大，从最早的编译器已经发展到了TVM Stack（如下图，和我之前文章里贴的图已经有了很大的变化），从新的IR（Relay），到自动编译优化的AutoTVM，到开源AI硬件加速器（VTA），开了很多有意思的话题。

source：tvm.ai

Glow是Pytorch的一部分，在AI编译器里算后起之秀，吸收了XLA和TVM的经验，有自己的特色，目前已经有一些厂商站台，也比较活跃。

XLA和Glow背后是Google和Facebook以及相应Learning Framework的生态，应该是未来AI编译器的主要玩家。而这些开源的编译器项目，也为各个做AI芯片的厂商提供了编译器框架的基础，大大降低了大家自研编译器的门槛。另一类编译器是针对专门硬件的，主要是芯片大厂的自研编译器，比如Nvidia的TensorRT，以及Intel，Xilinx的编译器。虽然，目前手工优化库也还是重要的优化方式，在一些架构上还是比编译器的结果好很多，但总的来说，编译器项目的繁荣，也是AI芯片产业逐渐成熟的表现。

AI芯片2.0

最后，我们详细看看Yann LeCun教授对未来AI硬件的预测。他的思考主要是从算法演进的需求出发，几个重点包括：

Dynamic Networks，简单来说就是神经网络的结构和数据相关，会根据输入数据（或者中间结果）选择不同的分支和操作。而目前AI加速，特别是对于Inference的加速，其高效执行的一个前提就是网络的确定性（静态性），其控制流和数据流是可以预先安排和优化好的。动态网络相当于把这个前提打破了，对架构的灵活性有更高的要求，需要在灵活性和高效性之间得找到新的平衡点。

Neural Network on Graphs。目前的神经网络处理的基本数据主要是张量tensor，相应的，目前的AI硬件的基本要求是对tensor运算的加速。而对于图网络来说，数据变成了以tensor为节点和边的图。如果图网络成为主流，则又改变了AI硬件设计的一个前提。专门用于图计算的芯片已经是一个重要的研究方向，落地的速度估计还得看算法演讲的速度有多快。

Memory-Augmented Networks。这个主要是对存储架构的新需求，特别是对长期记忆的模拟（在大量存储中实现Attention机制，我在之前的文章里也讨论过）。未来我们可能需要在大量memory中快速找到关注的内容，这要求存储器不只像目前一样实现简单的存取功能，还需要具备查询和运算能力，比如根据输入向量找到一组值；或者一次读取多个值，然后和一个输入向量做运算并输出结果。

Complex Inference and Search。这个问题简单来说就是在做inference的时候可能也需要支持反向传播计算，这当然会影响目前的单向inference运算加速的架构。

Sparse Activations。这个预测是说未来的神经网络可能是一个功能非常强大的巨型网络，但针对一个任务只需要激活极少一部分（之前Jeff Dean也做过类似预测）。这个问题涉及两个方面，一是如何利用稀疏性（比如像大脑一样只有2%激活）；另一个问题在于这个巨型网络的存储和运算。目前我们还不知道在这个方向上未来会发展到什么程度，不过这个趋势可能导致我们必须应对整个神经网络的存储和运算架构中出现的新的瓶颈问题。

当然，上述一些算法发展的趋势是Yann LeCun教授的看法，未来我们还可能看到其它算法上的演进甚至变革。芯片设计，特别是Domain-specific架构的芯片是由该领域的算法驱动的。算法的改变会影响我们的优化策略和trade off的sweet spot。正如Yann LeCun教授所说“New architectural concepts such as dynamic networks, graph data, associative-memory structures, and inference-through-minimization procedures are likely to affect the type of hardware architectures that will be required in the future.”。

第一代AI芯片从2016年开始爆发，到目前在架构设计上已经比较稳定，相关的编译器的技术越来越成熟，整个产业格局基本成型。可以说，目前的AI芯片软硬件技术已经为规模商用做好了准备（AI芯片0.5）。未来的一到三年中，我们应该可以看到“无芯片不AI”的景象（AI芯片1.0）。再看更远的未来，随着算法演进，应用落地，会不断给芯片提出新的要求，加上底层半导体技术的进步，我们可以期待在3到5年内看到第二次AI芯片技术创新的高潮（AI芯片2.0）。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
31399

浏览量
269810
人工智能

人工智能

+关注

关注
1793

文章
47590

浏览量
239495

原文标题：【科普】AI芯片0.5与2.0

文章出处：【微信号：TechSugar，微信公众号：TechSugar】欢迎添加关注！文章转载请注明出处。

MLCommons推出AI基准测试0.5版

开放式机器学习工程联盟 MLCommons 在美国加州当地时间公布推出适用于消费类 PC 的 AI 性能的 MLPerf Client 基准测试的 0.5 版，这是该测试的第一个公开版本

发表于 12-12 16:47 •372次阅读

阿里国际站首推全流程AI产品：AI生意助手2.0

阿里巴巴国际站近日正式推出了其首个全流程AI产品——AI生意助手2.0。这一创新产品的问世，标志着阿里巴巴国际站在推动中小企业外贸业务智能化方面迈出了重要一步。 AI生意助手

发表于 10-29 10:22 •406次阅读

立体声DAC芯片与普通DAC芯片的使用区别是什么？

立体声DAC芯片与普通DAC芯片除了数据接口不太一样外，在使用上还有什么区别吗，如PCM5012A这种芯片能不能把它当作普通双通道DAC来

发表于 10-23 07:49

请问同一款芯片，SOIC和SOP除了封装不同外，还有其他区别吗？

您好，TI工程师，请问同一款芯片，SOIC和SOP除了封装不同外，还有其他区别么？SOP和SOIC可以替换使用么？能不能详细解释下？

发表于 10-12 07:05

HDMI 2.0与HDMI 2.1有什么区别

HDMI 2.0与HDMI 2.1是高清多媒体接口（High-Definition Multimedia Interface）的两个不同版本，它们在带宽、传输速度、支持的视频格式、显示效果以及新技术支持等方面存在显著差异。以下是对两者区别的详细分析，旨在提供全面且深入的理

发表于 07-25 18:15 •4.4w次阅读

AI大模型与传统AI的区别

AI大模型（如LLM，即大型语言模型）与传统AI在多个方面存在显著的区别。以下将从技术层面、应用场景、性能表现、计算资源和成本、以及发展趋势和挑战等角度进行详细阐述。

发表于 07-15 11:37 •3013次阅读

人工智能芯片与服务器芯片的区别

人工智能芯片（AI芯片）与服务器芯片在多个方面存在显著差异，这些差异主要体现在设计目标、功能特性、应用场景以及技术发展趋势上。以下是对两者区别

发表于 07-12 18:21 •1732次阅读

hdmi线1.4和2.0有啥区别

HDMI线1.4和2.0在多个方面存在显著的区别，以下是对它们之间差异的分点表示和归纳：最大带宽： HDMI 1.4：最大带宽为10.2 Gbps。 HDMI 2.0：最大带宽提升至18 Gbps

发表于 06-21 10:00 •3366次阅读

AI芯片哪里买？

AI芯片

芯广场
发布于 :2024年05月31日 16:58:19

risc-v多核芯片在AI方面的应用

RISC-V多核芯片在AI方面的应用主要体现在其低功耗、低成本、灵活可扩展以及能够更好地适应AI算法的不同需求等特点上。首先，RISC-V适合用于高效设计实现，其内核面积更小，功耗更低，使得它能

发表于 04-28 09:20

ai芯片是什么东西 ai芯片和普通芯片的区别

AI芯片是专门为人工智能应用设计的处理器，它们能够高效地执行AI算法，特别是机器学习和深度学习任务。

发表于 03-21 18:11 •7391次阅读

fpga芯片和soc芯片的区别

FPGA芯片和SoC芯片在多个方面存在显著的区别。

发表于 03-14 17:28 •3258次阅读

fpga芯片和普通芯片的区别

FPGA芯片和普通芯片在多个方面存在显著的区别。

发表于 03-14 17:27 •1828次阅读

fpga芯片和人工智能芯片的区别

FPGA芯片和人工智能芯片（AI芯片）在设计和应用上存在一些关键的区别，这些区别主要体现在它们的

发表于 03-14 17:26 •1324次阅读

英伟达将用AI设计AI芯片

AI芯片行业资讯

深圳市浮思特科技有限公司
发布于 :2024年02月19日 17:54:43

搜索历史

“AI芯片0.5与2.0”还有这区别？

评论

MLCommons推出AI基准测试0.5版

阿里国际站首推全流程AI产品：AI生意助手2.0

立体声DAC芯片与普通DAC芯片的使用区别是什么？

请问同一款芯片，SOIC和SOP除了封装不同外，还有其他区别吗？

HDMI 2.0与HDMI 2.1有什么区别

AI大模型与传统AI的区别

人工智能芯片与服务器芯片的区别

hdmi线1.4和2.0有啥区别

AI芯片哪里买？

risc-v多核芯片在AI方面的应用

ai芯片是什么东西 ai芯片和普通芯片的区别

fpga芯片和soc芯片的区别

fpga芯片和普通芯片的区别

fpga芯片和人工智能芯片的区别

英伟达将用AI设计AI芯片