论AI的系统厂商vs系统厂商的AI-电子发烧友网

前言

10月初Dell在Austin的一个event “Bring AI to Your Data”宣传上，科技媒体65请了Dell 的一个VP来讨论，在讨论中一向比较直接的Patrick就问了一个所有系统厂商的灵魂问题：“Dell 在AI的软件和算法上没有投入，在AI加速的芯片上也没有投入，你们在谈AI到底在谈啥？”。好在是VP比较机灵，先谈“Dell是个大公司，客户多，很多客户不知道AI是个啥，Dell可以提供H100的GPU服务器，然后就是AI肯定要存储的，因为大数据要靠AI，数据的保护和管理，bablbabl.。.“。说实在的，如果AI的数据真的很重要的话。Samsung和Seagate应该是世界上市值最高的AI公司了。关心股市的同学知道，在这个宇宙中并不是。

俺是正统的系统厂商出身，毕业实习的时候在华腾（就是那个天腾和华东计算机所合资）做系统集成，很巧的是在俺公司现址的楼下，一天被当年带的新毕业生认出来，当年的毕业生已经是华腾的CTO了，在华腾工作了24年，从系统集成公司进化成上万人外包的大公司了。其实，在X86兴起的200X年代，互联网还在融资，系统集成公司的日子还是不错的，企业客户都面临这个信息化这个话题，系统集成公司是软硬一体的，可以像Dell今天满足客户AI需求一样满足客户的信息化需求。

当互联网兴起之后，系统集成公司的日子基本上到头了，互联网只要硬件，人家有的是软件工程师。后面，随着SSD出现，高速网络出现， intel手下的系统公司基本上被台厂，后面被互联网的系统部全部踢出局了。当然，俺早早的跳出这个领域，向下做到了SSD部件厂商，以至于前一段一个哥们问我服务器还是啥搞头，俺可是在联想，Dell做了快10年的服务器的人，居然真的想不出来服务器还能有啥花头。

缘起

回到正题， AI从2012年开始，基本上起起伏伏快10年了，在Nvidia面临游戏和加密货币的下滑的双重打击下，GPTx异军突起，让老黄放飞了自我。就像前面讲的一样，AI的投资基本上在AI的网络算法和AI加速器两个方向。为啥这次LLM只是火了AI算法，但是一票AI加速器公司反而悄无声息？原因也很简单，就像在Meta做AI Infra的Dr. Kim Hazelwood讲的一样，在AI的框架世界中，高效的框架是打不过好用的框架的，因为对算法工程来讲，2小时和12小时没有区别，反正下班前提交了，只要明天上班的时候能出来就行。

因此，在AI框架的竞争中，Pytorch战胜了TensorFlow【1】。

对了，Pytorch就是Meta的，前面的计算机科学家Kim的评论（2020）圆满了。而Pytorch的特点就是好用，有2000+ 算子，这个对于AI加速器来讲就是灭顶之灾。之前那些学Google TPU做脉动整列的，做Tensor/Vector加速的startup基本上被强大的CUDA打趴下了。

但是，如果是这样的话，就没有本文的标题了，在硅谷走老黄的路的公司基本都没有了，只有中国还在和A股互动炒作GPU的概念，而真正可以对标老黄的公司都不是走GPU的路线。反而是两家做可编程DataFlow的公司成为了热点，而且都是AI的系统公司。

Sambanova

Kunle Olukotun的名号是“Father of The Mutil-Core Processor”，之前的公司是Afara Websystem，做最早的多核系统。

从这一页，看不懂Niagara的同学可以劝退了。看懂的童鞋可以点赞了。这么老的古董，现在散落在不同的公司的Sun可以缅怀一分钟。

另一个大佬是Chris，主要是做软件的，公司被Apple收购。

做多核CPU和做大数据管理的在一起，故事很直接。ML Application就是Software 2.0呀。

2019年回来的芯片很大很大，比GPU还大，725mm2。4个DDR4 controller支持1.5T。64Lane PCIe Gen4.0 做单机8卡互联。（不错，我们是I/O控）。

这张图说明了，2019年已经tapeout的片子，现在刚刚热起来。编译器的能力，特别是可编程的并行能力，需要时间呀。

芯片上的主要部分，和大部分AI加速器类似，计算单元，SRAM做weight/gradient的保存， AGU和SU做数据路由，CU就是控制了。

单机8卡，和老黄对标。

产品文档很全面，有自己的编译器和开发环境。硬件也是用AMD的PCIe的标准服务器带8个加速器。其中的HCI就是自己互联的方案，基于PCIe Gen4，从接口的形态看应该是4口一组的PCIe HBA类似。

HCI组网方式基本上就是full mesh，4个计算节点互联和头节点互联。节点之间的连接还有用RoCEv2的Ethernet以及junper的交换机。只是HCI没有用PCIe switch，看cable做pointer to pointer的互联，可能和NVLinkv1一样，没有做NVSwitch。

作为AI的系统厂商来讲，Sambanova还是很不错的，除了一些美国的国家实验室以外，还有一些做金融和文本处理的公司。而且关键是2代的芯片也回来了，支持HBM，支持5T的LLMs【2】。

Cerebras

说到这家，必须讲它的出处 SeaMicro. 对，下图就是8个server在一个5X11英寸的PCB上。它是ARM进军数据中心的先烈，被AMD收购了，被Lisa SU杀死了。这种类型的板子，我当年在DCS的时候也搞过类似的低功耗MicroServer。

Cerebras的核心人物都是SeaMicro的背景。

关于Cerebas，正好之前有材料，这里就快速总结了。

通过RoCEv2的RDMA进行系统扩展。weight的存储和计算节点通过ethernet互联。

对于Weight节点独立，很好地解决了GPU因为内存不够出现的data 并行的问题，在大模型时代成了杀手锏。通过On-Chip Memory和MemoryX的流水线处理，很好地解决了之前GPU training中参数服务器的问题。

计算单元的设计还是软硬结合，编译器做调度编排，整个片子上网络没有中心的控制。

最后，在LLMs时代，Pytorch的胜利逻辑会继续。

相对于Sambanova，因为Cerebras的步子更大，不仅在国家实验室有落地，更加在LLMs时代找到了方向。

尾声

在过去2016年AI的创业风潮起来之后，GPU的颠覆者到现在还没有出现，的确让人比较遗憾。后面的路会怎么走，我还是比较认可Andrej Karpathy的判断， Transformers可能会走上模型的统一。

模型+数据+算力=ML Application， Chris指出的方向也许是AI创业公司盈利的方向？？？

回到正题，也许下一波就是AI公司成为AI系统厂商，或者系统厂商收购AI公司成为AI系统厂商的时代了。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

互联网

互联网

+关注

关注
54

文章
11153

浏览量
103271
AI

AI

+关注

关注
87

文章
30830

浏览量
268984
pytorch

pytorch

+关注

关注
2

文章
808

浏览量
13219

原文标题：论AI的系统厂商 vs.系统厂商的AI

文章出处：【微信号：SDNLAB，微信公众号：SDNLAB】欢迎添加关注！文章转载请注明出处。

【免费直播】AI芯片专家陈小柏博士，带你解析AI算法及其芯片操作系统。

智慧化进程。人工智能芯片是人工智能发展的基石，是数据、算法和算力在各类场景应用落地的基础依托。“无芯片不AI”已经深入人心，成为业界共识。本次直播将述说AI芯片设计带你解析AI算法及其芯片操作

发表于 11-07 14:03

【免费直播】让AI芯片拥有最强大脑—AI芯片的操作系统设计介绍.

智慧化进程。人工智能芯片是人工智能发展的基石，是数据、算法和算力在各类场景应用落地的基础依托。“无芯片不AI”已经深入人心，成为业界共识。本次直播将述说AI芯片设计带你解析AI算法及其芯片操作

发表于 11-07 14:18

AI时代FPGA厂商与FPGA工程师要如何转型？

AI时代FPGA厂商与FPGA工程师该如何转型？

发表于 06-08 11:50

开源的鸿蒙系统其他手机厂商会用吗？

”危机。但即便如此，华为也将在这次开发者大会上直接将华为鸿蒙OS系统全球免费开源，这意味着华为鸿蒙OS系统2.0正式版也会被应用到更多的智能设备之中，不仅仅华为终端设备能用，就连其他国产厂商也都能够

发表于 09-24 10:42

为什么需要嵌入式AI？

为什么需要嵌入式AI？嵌入式AI还有瓶颈半导体厂商的新商机

发表于 01-22 06:14

AI芯片最新格局分析精选资料分享

来源：中金公司，作者黄乐平、何枚与杨俊杰AI 芯片设计是人工智能产业链的重要一环。自 2017 年 5 月以来，各 AI 芯片厂商的新品竞相发布，经过一年多的发展，各环...

发表于 07-23 07:08

AI芯片最新格局分析精选资料分享

来源：中金公司，作者黄乐平、何玫与杨俊杰AI 芯片设计是人工智能产业链的重要一环。自 2017 年 5 月以来，各 AI 芯片厂商的新品竞相发布，经过一年多的发展，各环...

发表于 07-23 07:14

VS-AI-BC01的特点是什么？软件如何配置？

VS-AI-BC01的特点是什么？软件如何配置？

发表于 12-27 07:49

【开发教程11】AI语音人脸识别（会议记录仪-人脸打卡机）-AI语音系统架构

CC3200AI实验教程——疯壳·开发板系列AI语音系统架构AI语音识别系统的系统架构如图1.0

发表于 05-20 15:35

【开发教程14】AI语音人脸识别（会议记录仪-人脸打卡机）-AI人脸系统架构

CC3200AI实验教程——疯壳·开发板系列AI人脸系统架构AI人脸识别系统由7大块组成，分别是摄像头、CC3200、串口调试助手、路由器、

发表于 06-10 14:32

【CC3200AI实验教程11】疯壳·AI语音人脸识别-AI语音系统架构

CC3200AI实验教程——疯壳·开发板系列AI语音系统架构AI语音识别系统的系统架构如图1.0

发表于 08-30 14:54

【CC3200AI实验教程14】疯壳·AI语音人脸识别-AI人脸系统架构

CC3200AI实验教程——疯壳·开发板系列AI人脸系统架构AI人脸识别系统由7大块组成，分别是摄像头、CC3200、串口调试助手、路由器、

发表于 08-31 16:35

已结束-【书籍评测活动】一本书，汇聚华为、旷视、高通等主流厂商的AI技术

，各互联网厂商、终端厂商和芯片厂商陆续推出了各种深度学习推理框架，用于在移动终端设备上通过设备的AI芯片运行人工智能推理任务，比如Google公司的TensorFlow Lite、华为

发表于 01-31 09:30

对AI芯片的厂商进行归纳和整理

众所周知，人工智能的三大支柱是硬件、算法和数据。其中，硬件主要是指用于运行AI算法的芯片。本文主要对AI芯片的厂商进行归纳和整理。

发表于 12-25 15:52 •4026次阅读

AI芯片Top15只有华为一家？国内AI芯片厂商去哪了？

在全球知名调研机构Compass Intelligence的一份报告中，对当前致力于AI芯片的公司给出了一份排名：华为作为国内第一AI芯片厂商上榜，但在这份榜单中却位居第12位。此外，国内AI

发表于 06-15 09:45 •6232次阅读

搜索历史

论AI的系统厂商vs系统厂商的AI

评论

【免费直播】AI芯片专家陈小柏博士，带你解析AI算法及其芯片操作系统。

【免费直播】让AI芯片拥有最强大脑—AI芯片的操作系统设计介绍.

AI时代FPGA厂商与FPGA工程师要如何转型？

开源的鸿蒙系统其他手机厂商会用吗？

为什么需要嵌入式AI？

AI芯片最新格局分析精选资料分享

AI芯片最新格局分析精选资料分享

VS-AI-BC01的特点是什么？软件如何配置？

【开发教程11】AI语音人脸识别（会议记录仪-人脸打卡机）-AI语音系统架构

【开发教程14】AI语音人脸识别（会议记录仪-人脸打卡机）-AI人脸系统架构

【CC3200AI实验教程11】疯壳·AI语音人脸识别-AI语音系统架构

【CC3200AI实验教程14】疯壳·AI语音人脸识别-AI人脸系统架构

已结束-【书籍评测活动】一本书，汇聚华为、旷视、高通等主流厂商的AI技术

对AI芯片的厂商进行归纳和整理

AI芯片Top15只有华为一家？国内AI芯片厂商去哪了？