1.5T内存挑战英伟达！8枚芯片撑起3个GPT-4，华人AI芯片独角兽估值365亿-电子发烧友网

高端GPU持续缺货之下，一家要挑战英伟达的芯片初创公司成为行业热议焦点。

8枚芯片跑大模型，就能支持5万亿参数（GPT-4的三倍）。

这是独角兽企业SambaNova刚刚发布的新型AI芯片SN40L——

型号中40代表是他们第四代产品，L代表专为大模型（LLM）优化：高达1.5T的内存，支持25.6万个token的序列长度。

CEORodrigo Liang表示，当前行业标准做法下运行万亿参数大模型需要数百枚芯片，我们的方法使总拥有成本只有标准方法的1/25。

SambaNova目前估值50亿美元（约365亿人民币），累计完成了6轮总计11亿美元的融资，投资方包括英特尔、软银、三星、GV等。

他们不仅在芯片上要挑战英伟达，业务模式上也说要比英伟达走的更远：直接参与帮助企业训练私有大模型。

目标客户上野心更是很大：瞄准世界上最大的2000家企业。

1.5TB内存的AI芯片

最新产品SN40L，由台积电5纳米工艺制造，包含1020亿晶体管，峰值速度638TeraFLOPS。

与英伟达等其他AI芯片更大的不同在于新的三层Dataflow内存系统。

520MB片上SRAM内存

65GB的高带宽HBM3内存

以及高达1.5TB的外部DRAM内存

与主要竞品相比，英伟达H100最高拥有80GB HBM3内存，AMD MI300拥有192GB HBM3内存。

SN40L的高带宽HBM3内存实际比前两者小，更多依靠大容量DRAM。

Rodrigo Liang表示，虽然DRAM速度更慢，但专用的软件编译器可以智能地分配三个内存层之间的负载，还允许编译器将8个芯片视为单个系统。

除了硬件指标，SN40L针对大模型做的优化还有同时提供密集和稀疏计算加速。

他们认为大模型中许多权重设置为0，像其他数据一样去执行操作很浪费。

他们找到一种软件层面的加速办法，与调度和数据传输有关，但没有透露细节，“我们还没准备好向公布是如何做到这一点的”。

咨询机构Gartner的分析师Chirag Dekate认为，SN40L的一个可能优势在于多模态AI。

GPU的架构非常严格，面对图像、视频、文本等多样数据时可能不够灵活，而SambaNova可以调整硬件来满足工作负载的要求。

目前，SambaNova的芯片和系统已获得不少大型客户，包括世界排名前列的超算实验室，日本富岳、美国阿贡国家实验室、劳伦斯国家实验室，以及咨询公司埃森哲等。

业务模式也比较特别，芯片不单卖，而是出售其定制技术堆栈，从芯片到服务器系统，甚至包括部署大模型。

为此，他们与TogetherML联合开发了BloomChat，一个1760亿参数的多语言聊天大模型。

BloomChat建立在BigScience组织的开源大模型Bloom之上，并在来自OpenChatKit、Dolly 2.0和OASST1的OIG上进行了微调。

训练过程中，它使用了SambaNova独特的可重配置数据流架构，然后在SambaNova DataScale系统进行训练。

这也是这家公司最大被投资者热捧之外的最大争议点之一，很多人不看好一家公司既做芯片又做大模型。

给每家大企业打造150个大模型

在与The Next Platform网站交流时，CEO Rodrigo Liang表示：

用于大模型训练的公开数据已快耗尽，但对参数数量的追求还在不断增加。

各种大模型的性能相差只有几个百分点，这不是大家应该玩的游戏。

他认为大模型与生成式AI商业化的下一个战场是企业的私有数据，尤其是大企业。

这些企业坐拥大量的数据，但自己不知道其中大部分内容是什么。

对于企业私有大模型的形态，SambaNova也有与众不同的观点。

他们认为最终企业内部不会运行一个GPT-4或谷歌Gemini那样的超大模型，而是根据不同数据子集创建150个独特的模型，聚合参数超过万亿。

相当于把GPT-4等大模型内部的Mixture of Experts（专家混合）架构扩展到整个系统，称为Composition of Experts（专家合成）。

在企业运转的每个节点运行一个完整且经过专门调整的基础模型，分别用法律语料库、制造语料库、风险管理语料库、财富管理语料库、客户销售语料库、客户支持语料库等等不同数据训练。

这些专家模型之间通过一种软件路由或负载平衡器联在一起，收到推理请求后决定具体向哪个模型推送提示词。

这一策略与GPT-4和谷歌Gemini等做法形成鲜明对比，巨头大多希望创建一个能泛化到数百万个任务的巨型模型。

分析师认为技术上可能谷歌的做法性能更强，但SambaNova的方法对企业来说更实用。

没有任何一个模型或人能完整访问企业的所有数据，限制每个部门能访问的专家模型，就能限制他们能访问的数据。

斯坦福系芯片公司，华人工程师主力

SambaNova成立于2017年，2020年之前都比较低调。

联创3人都是斯坦福背景，连产品系列名Cardinal（深红色）都是斯坦福的昵称与代表颜色。

CEO Rodrigo Liang是前Sun/甲骨文工程副总裁，也有人将这个名字解读为暗指甲骨文老对头IBM的DeepBlue（深蓝）。

另外两位联合创始人都是斯坦福教授。

CTOKunle Olukotun是电气工程教授，因多核芯片架构方面的研究而闻名，开发了首批支持线程级推测 (TLS) 的芯片之一。

Christopher Ré是计算机科学副教授，重点研究方向机器学习和数据分析的速度和可扩展性。

此外团队中还有不少华人工程师。

从官网公开信息来看，SambaNova的领导团队中，至少有3名华人。

Jonathan Chang，拥有UC伯克利的机械工程学士学位以及南加州大学的MBA学位。

他在构建高增长方面拥有20多年的经验。加入SambaNova之前，Chang在特斯拉工作了近9年。

Marshall Choy，此前曾担任甲骨文公司系统产品管理和解决方案开发副总裁，监督了数十个行业的企业硬件和软件产品的上市。

Penny Li，在EDA工具和微处理器设计方面拥有超过27年的经验。此前，她曾在IBM和甲骨文工作过。

如果去领英搜索还能发现更多华人团队成员。

目前SambaNova包含SN40L芯片的人工智能引擎已上市，但定价没有公开。

根据Rodrigo Liang的说法，8个SN40L组成的集群总共可处理5万亿参数，相当于70个700亿参数大模型。

全球2000强的企业只需购买两个这样的8芯片集群，就能满足所有大模型需求。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

gpu

gpu

+关注

关注
28

文章
4752

浏览量
129054
英伟达

英伟达

+关注

关注
22

文章
3791

浏览量
91294
AI芯片

AI芯片

+关注

关注
17

文章
1890

浏览量
35096

原文标题：1.5T内存挑战英伟达！8枚芯片撑起3个GPT-4，华人AI芯片独角兽估值365亿

文章出处：【微信号：WW_CGQJS，微信公众号：传感器技术】欢迎添加关注！文章转载请注明出处。

汇顶科技拟并购芯片独角兽云英谷

近日，半导体领域再次发生一起引人注目的并购事件。国内知名芯片企业汇顶科技宣布，计划通过发行股份及支付现金的方式，收购芯片独角兽云英谷的控制权。

发表于 12-03 12:59 •485次阅读

Tenstorrent获7亿美元融资，贝索斯参投挑战英伟达

AI芯片初创公司Tenstorrent近日宣布获得高达7亿美元的融资，公司估值也随之攀升至26亿

发表于 12-03 11:07 •312次阅读

英伟达加速认证三星AI内存芯片

近日，英伟达公司正在积极推进对三星AI内存芯片的认证工作。据英伟

发表于 11-25 14:34 •263次阅读

亿铸科技荣登中国潜在独角兽企业榜单

在近日举办的“2024中国潜在独角兽企业发展大会”上，长城战略咨询隆重发布了《GEI中国潜在独角兽企业研究报告2024》，深度剖析了中国潜在独角兽企业的最新发展动态。该报告连续第五年发布，亿

发表于 11-18 10:12 •359次阅读

主线科技荣登中国潜在独角兽企业榜单

日前，长城咨询重磅发布2024年GEI中国潜在独角兽企业榜单及研究报告。主线科技凭借卓越的技术硬实力、前瞻性的市场布局以及持续的创新活力，从众多竞争者中脱颖而出，荣获“潜在独角兽”称号。中国潜在

发表于 11-12 17:17 •582次阅读

连续3年！路凯智行荣登中国潜在独角兽榜单

超过十年，获得过私募投资，且尚未上市，最近一轮融资的投后估值超过（含）10亿美元的企业。潜在独角兽企业则一般是获得过私募投资，且尚未上市，成立5年之内，最新一轮融资

发表于 11-04 13:32 •339次阅读

AI芯片巨头英伟达涨超4% 英伟达市值暴增7500亿

行业股票开始反弹，那么英伟达公司的股票将是个不错的选择。还有瑞穗证券（Mizuho）也认为英伟达公司的股价仍有很大的上涨空间。美

发表于 08-13 15:33 •1109次阅读

估值160亿，背靠国产传感器首富，浙江诞生中国唯一民营晶圆代工独角兽

此前，胡润研究院发布《2024全球独角兽榜》，列出了全球成立于2000年之后，价值10亿美元以上的非上市公司。其中，来自浙江宁波的晶圆制造企业——荣芯半导体，估值160

发表于 08-02 08:44 •2481次阅读

2023年中国传感器跑出9家独角兽公司，总估值达1807亿！（附全名单）

核聚变、GPU芯片、半导体材料、氢能、新型储能、合成生物等领域加快涌现独角兽企业。集成电路、清洁能源、商业航天等前沿科技领域独角兽企业数量占比近七成（249家），新晋独角兽企业中这一比

发表于 06-20 15:43 •7067次阅读

200亿，这里崛起一个半导体超级独角兽

，最终入局的包括了国家级基金、地方国资、半导体专业基金及券商系基金等阵容。根据增资比例计算，时代半导体估值超200亿，堪称湖南年度最大独角兽。而透过这只

发表于 05-30 10:48 •491次阅读

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

，通过英伟达高带宽接口（NV-HBI）将两个最大可制造芯片合并为一个图形处理器单元，支持10TB/s带宽，形成高效的通信通道，提升整体性能。

发表于 05-13 17:16

东风岚图以305亿元估值入选《2024全球独角兽榜》

4月9日，胡润研究院发布《2024全球独角兽榜》列出全球成立于2000年之后价值10亿美元以上的非上市公司

发表于 04-12 09:21 •429次阅读

深兰科技再次入围《2024胡润全球独角兽榜》

4月9日，胡润研究院于广州发布了《2024全球独角兽榜》，榜单列出了全球成立于2000年之后，企业估值价值在10亿美元以上的非上市公司。深兰

发表于 04-11 09:17 •671次阅读

英国AI芯片独角兽Graphcore考虑出售

近日，英国AI芯片领域的独角兽企业Graphcore陷入财务困境，据传正在考虑出售给海外买家以筹集新资金并弥补严重亏损。据外媒报道，Graphcore正与多家主要科技公司探讨潜在交易，其中包括英国半导体IP巨头Arm、日本软银集

发表于 02-19 13:46 •642次阅读

禾多科技入选2023年中国新经济人工智能独角兽

」，致力于展现全球新经济行业最具成长性和最具价值的未上市创新创业公司。「独角兽俱乐部」上榜公司要求企业最新估值在10亿美元及以上，或其新一轮融资额在2

发表于 01-23 18:43 •1287次阅读