0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

论AI的系统厂商vs系统厂商的AI

SDNLAB 来源:SDNLAB 2023-11-14 17:27 次阅读

01

前 言

10月初Dell在Austin的一个event “Bring AI to Your Data”宣传上,科技媒体65请了Dell 的一个VP来讨论,在讨论中一向比较直接的Patrick就问了一个所有系统厂商的灵魂问题:“Dell 在AI的软件和算法上没有投入,在AI加速的芯片上也没有投入,你们在谈AI到底在谈啥?”。好在是VP比较机灵,先谈“Dell是个大公司,客户多,很多客户不知道AI是个啥,Dell可以提供H100的GPU服务器,然后就是AI肯定要存储的,因为大数据要靠AI,数据的保护和管理,bablbabl.。.“。说实在的,如果AI的数据真的很重要的话。Samsung和Seagate应该是世界上市值最高的AI公司了。关心股市的同学知道,在这个宇宙中并不是。

俺是正统的系统厂商出身,毕业实习的时候在华腾(就是那个天腾和华东计算机所合资)做系统集成,很巧的是在俺公司现址的楼下,一天被当年带的新毕业生认出来,当年的毕业生已经是华腾的CTO了,在华腾工作了24年,从系统集成公司进化成上万人外包的大公司了。其实,在X86兴起的200X年代,互联网还在融资,系统集成公司的日子还是不错的,企业客户都面临这个信息化这个话题,系统集成公司是软硬一体的,可以像Dell今天满足客户AI需求一样满足客户的信息化需求。

当互联网兴起之后,系统集成公司的日子基本上到头了,互联网只要硬件,人家有的是软件工程师。后面,随着SSD出现,高速网络出现, intel手下的系统公司基本上被台厂,后面被互联网的系统部全部踢出局了。当然,俺早早的跳出这个领域,向下做到了SSD部件厂商,以至于前一段一个哥们问我服务器还是啥搞头,俺可是在联想,Dell做了快10年的服务器的人,居然真的想不出来服务器还能有啥花头。

02

缘 起

回到正题, AI从2012年开始,基本上起起伏伏快10年了,在Nvidia面临游戏和加密货币的下滑的双重打击下,GPTx异军突起,让老黄放飞了自我。就像前面讲的一样,AI的投资基本上在AI的网络算法和AI加速器两个方向。为啥这次LLM只是火了AI算法,但是一票AI加速器公司反而悄无声息?原因也很简单,就像在Meta做AI Infra的Dr. Kim Hazelwood讲的一样,在AI的框架世界中,高效的框架是打不过好用的框架的,因为对算法工程来讲,2小时和12小时没有区别,反正下班前提交了,只要明天上班的时候能出来就行。

因此,在AI框架的竞争中,Pytorch战胜了TensorFlow【1】。

a75d344e-820b-11ee-939d-92fbcf53809c.png

对了,Pytorch就是Meta的,前面的计算机科学家Kim的评论(2020)圆满了。而Pytorch的特点就是好用,有2000+ 算子,这个对于AI加速器来讲就是灭顶之灾。之前那些学Google TPU做脉动整列的,做Tensor/Vector加速的startup基本上被强大的CUDA打趴下了。

a76c398a-820b-11ee-939d-92fbcf53809c.jpg

但是,如果是这样的话,就没有本文的标题了,在硅谷走老黄的路的公司基本都没有了,只有中国还在和A股互动炒作GPU的概念,而真正可以对标老黄的公司都不是走GPU的路线。反而是两家做可编程DataFlow的公司成为了热点,而且都是AI的系统公司。

03

Sambanova

a77dfdc8-820b-11ee-939d-92fbcf53809c.png

Kunle Olukotun的名号是“Father of The Mutil-Core Processor”,之前的公司是Afara Websystem,做最早的多核系统。

a78d7528-820b-11ee-939d-92fbcf53809c.png

从这一页,看不懂Niagara的同学可以劝退了。看懂的童鞋可以点赞了。这么老的古董,现在散落在不同的公司的Sun可以缅怀一分钟。

a7adff64-820b-11ee-939d-92fbcf53809c.png

另一个大佬是Chris,主要是做软件的,公司被Apple收购。

a7bc9448-820b-11ee-939d-92fbcf53809c.png

做多核CPU和做大数据管理的在一起,故事很直接。ML Application就是Software 2.0呀。

a7d23550-820b-11ee-939d-92fbcf53809c.png

2019年回来的芯片很大很大,比GPU还大,725mm2。4个DDR4 controller支持1.5T。64Lane PCIe Gen4.0 做单机8卡互联。(不错,我们是I/O控)。

a7e0d8f8-820b-11ee-939d-92fbcf53809c.png

这张图说明了,2019年已经tapeout的片子,现在刚刚热起来。编译器的能力,特别是可编程的并行能力,需要时间呀。

a7f830e8-820b-11ee-939d-92fbcf53809c.png

芯片上的主要部分,和大部分AI加速器类似,计算单元,SRAM做weight/gradient的保存, AGU和SU做数据路由,CU就是控制了。

a8056970-820b-11ee-939d-92fbcf53809c.png

单机8卡,和老黄对标。

a80f2820-820b-11ee-939d-92fbcf53809c.png

a82aad20-820b-11ee-939d-92fbcf53809c.png

产品文档很全面,有自己的编译器和开发环境。硬件也是用AMD的PCIe的标准服务器带8个加速器。其中的HCI就是自己互联的方案,基于PCIe Gen4,从接口的形态看应该是4口一组的PCIe HBA类似。

a84bdca2-820b-11ee-939d-92fbcf53809c.png

a8590490-820b-11ee-939d-92fbcf53809c.png

HCI组网方式基本上就是full mesh,4个计算节点互联和头节点互联。 节点之间的连接还有用RoCEv2的Ethernet以及junper的交换机。只是HCI没有用PCIe switch,看cable做pointer to pointer的互联,可能和NVLinkv1一样,没有做NVSwitch。

a86fde68-820b-11ee-939d-92fbcf53809c.png

作为AI的系统厂商来讲,Sambanova还是很不错的,除了一些美国的国家实验室以外,还有一些做金融和文本处理的公司。而且关键是2代的芯片也回来了,支持HBM, 支持5T的LLMs【2】。

a887b83a-820b-11ee-939d-92fbcf53809c.png

04

Cerebras

说到这家,必须讲它的出处 SeaMicro. 对,下图就是8个server在一个5X11英寸的PCB上。它是ARM进军数据中心的先烈,被AMD收购了,被Lisa SU杀死了。这种类型的板子,我当年在DCS的时候也搞过类似的低功耗MicroServer。

a8aaa1ba-820b-11ee-939d-92fbcf53809c.png

Cerebras的核心人物都是SeaMicro的背景。

a8bfee6c-820b-11ee-939d-92fbcf53809c.png

关于Cerebas,正好之前有材料,这里就快速总结了。

a8d7b1c8-820b-11ee-939d-92fbcf53809c.png

通过RoCEv2的RDMA进行系统扩展。weight的存储和计算节点通过ethernet互联。

a8ef27e0-820b-11ee-939d-92fbcf53809c.png

对于Weight节点独立,很好地解决了GPU因为内存不够出现的data 并行的问题,在大模型时代成了杀手锏。通过On-Chip Memory和MemoryX的流水线处理,很好地解决了之前GPU training中参数服务器的问题。

a90bf3de-820b-11ee-939d-92fbcf53809c.png

计算单元的设计还是软硬结合,编译器做调度编排,整个片子上网络没有中心的控制。

a91b68be-820b-11ee-939d-92fbcf53809c.png

最后,在LLMs时代,Pytorch的胜利逻辑会继续。

a975516c-820b-11ee-939d-92fbcf53809c.png

相对于Sambanova, 因为Cerebras的步子更大,不仅在国家实验室有落地,更加在LLMs时代找到了方向。

a9895b62-820b-11ee-939d-92fbcf53809c.png

05

尾 声

在过去2016年AI的创业风潮起来之后,GPU的颠覆者到现在还没有出现,的确让人比较遗憾。后面的路会怎么走,我还是比较认可Andrej Karpathy的判断, Transformers可能会走上模型的统一。

a9a665c2-820b-11ee-939d-92fbcf53809c.png

模型+数据+算力=ML Application, Chris指出的方向也许是AI创业公司盈利的方向???

回到正题,也许下一波就是AI公司成为AI系统厂商,或者系统厂商收购AI公司成为AI系统厂商的时代了。

a9b53a52-820b-11ee-939d-92fbcf53809c.png

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 互联网
    +关注

    关注

    54

    文章

    11153

    浏览量

    103271
  • AI
    AI
    +关注

    关注

    87

    文章

    30830

    浏览量

    268984
  • pytorch
    +关注

    关注

    2

    文章

    808

    浏览量

    13219

原文标题:论AI的系统厂商 vs.系统厂商的AI

文章出处:【微信号:SDNLAB,微信公众号:SDNLAB】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【免费直播】AI芯片专家陈小柏博士,带你解析AI算法及其芯片操作系统

    智慧化进程。人工智能芯片是人工智能发展的基石,是数据、算法和算力在各类场景应用落地的基础依托。“无芯片不AI”已经深入人心,成为业界共识。本次直播将述说AI芯片设计带你解析AI算法及其芯片操作
    发表于 11-07 14:03

    【免费直播】让AI芯片拥有最强大脑—AI芯片的操作系统设计介绍.

    智慧化进程。人工智能芯片是人工智能发展的基石,是数据、算法和算力在各类场景应用落地的基础依托。“无芯片不AI”已经深入人心,成为业界共识。本次直播将述说AI芯片设计带你解析AI算法及其芯片操作
    发表于 11-07 14:18

    AI时代FPGA厂商与FPGA工程师要如何转型?

    AI时代FPGA厂商与FPGA工程师该如何转型?
    发表于 06-08 11:50

    开源的鸿蒙系统其他手机厂商会用吗?

    ”危机。但即便如此,华为也将在这次开发者大会上直接将华为鸿蒙OS系统全球免费开源,这意味着华为鸿蒙OS系统2.0正式版也会被应用到更多的智能设备之中,不仅仅华为终端设备能用,就连其他国产厂商也都能够
    发表于 09-24 10:42

    为什么需要嵌入式AI

    为什么需要嵌入式AI?嵌入式AI还有瓶颈半导体厂商的新商机
    发表于 01-22 06:14

    AI芯片最新格局分析 精选资料分享

    来源:中金公司,作者黄乐平、何枚与杨俊杰AI 芯片设计是人工智能产业链的重要一环。 自 2017 年 5 月以来,各 AI 芯片厂商的新品竞相发布,经过一年多的发展,各环...
    发表于 07-23 07:08

    AI芯片最新格局分析 精选资料分享

    来源:中金公司,作者黄乐平、何玫与杨俊杰AI 芯片设计是人工智能产业链的重要一环。 自 2017 年 5 月以来,各 AI 芯片厂商的新品竞相发布,经过一年多的发展,各环...
    发表于 07-23 07:14

    VS-AI-BC01的特点是什么?软件如何配置?

    VS-AI-BC01的特点是什么?软件如何配置?
    发表于 12-27 07:49

    【开发教程11】AI语音人脸识别(会议记录仪-人脸打卡机)-AI语音系统架构

    CC3200AI实验教程——疯壳·开发板系列AI语音系统架构AI语音识别系统系统架构如图1.0
    发表于 05-20 15:35

    【开发教程14】AI语音人脸识别(会议记录仪-人脸打卡机)-AI人脸系统架构

    CC3200AI实验教程——疯壳·开发板系列AI人脸系统架构AI人脸识别系统由7大块组成,分别是摄像头、CC3200、串口调试助手、路由器、
    发表于 06-10 14:32

    【CC3200AI实验教程11】疯壳·AI语音人脸识别-AI语音系统架构

    CC3200AI实验教程——疯壳·开发板系列AI语音系统架构AI语音识别系统系统架构如图1.0
    发表于 08-30 14:54

    【CC3200AI实验教程14】疯壳·AI语音人脸识别-AI人脸系统架构

    CC3200AI实验教程——疯壳·开发板系列AI人脸系统架构AI人脸识别系统由7大块组成,分别是摄像头、CC3200、串口调试助手、路由器、
    发表于 08-31 16:35

    已结束-【书籍评测活动】一本书,汇聚华为、旷视、高通等主流厂商AI技术

    ,各互联网厂商、终端厂商和芯片厂商陆续推出了各种深度学习推理框架,用于在移动终端设备上通过设备的AI芯片运行人工智能推理任务,比如Google公司的TensorFlow Lite、华为
    发表于 01-31 09:30

    AI芯片的厂商进行归纳和整理

    众所周知,人工智能的三大支柱是硬件、算法和数据。其中,硬件主要是指用于运行AI算法的芯片。本文主要对AI芯片的厂商进行归纳和整理。
    的头像 发表于 12-25 15:52 4026次阅读

    AI芯片Top15只有华为一家?国内AI芯片厂商去哪了?

    在全球知名调研机构Compass Intelligence的一份报告中,对当前致力于AI芯片的公司给出了一份排名:华为作为国内第一AI芯片厂商上榜,但在这份榜单中却位居第12位。此外,国内AI
    的头像 发表于 06-15 09:45 6232次阅读