0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

韩国无晶圆厂初创公司Panmnesia展示第一个支持CXL的AI集群

SSDFans 来源:SSDFans 2024-11-28 11:04 次阅读

在2024OCP全球峰会上,开发CXL交换机SoC和CXL IP的韩国无晶圆厂初创公司Panmnesia展示了第一个支持CXL的AI集群,该集群采用CXL 3.1交换机。

OCP全球峰会由世界上最大的数据中心硬件开发委员会OCP主办。在活动期间,全球相关公司将讨论如何构建具有成本效益和可持续性的数据中心IT基础设施的解决方案。在今年特别关注AI相关主题的活动中,Panmnesia展示了其支持CXL的AI集群,以加速用于ChatGPT等服务的下一代人工智能应用RAG,扩大其全球客户群。

AI竞争的加剧凸显了CXL的必要性

鉴于AI服务的重要性日益增加,企业正在努力提高其AI服务的质量。近年来,人们不断尝试提高准确率,特别是通过增加AI模型的规模或利用更多的数据。这导致企业对内存的需求增加。为了增加内存容量,企业通常会增加更多的服务器。但是,增加更多的服务器会给公司带来不必要的支出,因为它们需要购买内存本身之外的一系列服务器组件。

这就是下一代连接技术CXL发挥作用的地方。与前一种方法相比,CXL提供了一种扩展内存的新方法。使用CXL,公司只需要购买内存和CXL设备,而不需要花钱购买额外的服务器组件。因此,CXL吸引了一些大型IT公司的兴趣,这些公司一直遭受着与低效内存扩展相关的成本困扰。

AI的CXL解决方案

在CXL获得全球关注的同时,Panmnesia也因其在CXL技术开发方面的领导地位而吸引了业界的兴趣。该公司首次在2022年USENIX年度技术会议上推出了世界上第一个带有CXL 2.0交换机的完整系统框架“DirectCXL”,引起了人们的关注。该公司在2023超级计算展览会上推出了世界上第一个包含所有类型CXL 3.0/3.1组件的系统,进一步巩固了其在CXL技术方面的领先地位。此外,该公司还宣布了CXL解决方案,以加速AI,响应行业需求。

在2023年闪存峰会(CES)上,该公司在其CXL 3.0/3.1框架上展示了推荐系统(商业上使用最多的AI应用之一)的加速。随后,在CES 2024上,Panmnesia宣布了一款支持CXL的AI加速器,通过处理接近内存的数据来减少数据移动开销,从而获得了CES创新奖。在今年的OCP/OpenInfra峰会上,该公司推出了通过CXL技术扩展GPU系统内存的解决方案CXL-GPU,进一步巩固了Panmnesia作为AI CXL解决方案领导者的地位。

启用了CXL的AI集群

在2024年OCP全球峰会上,Panmnesia展示了支持CXL的AI集群,它代表了该公司以AI为重点的CXL技术前沿。

支持CXL的AI集群包括一个配备CXL内存扩展器的“CXL-Memory节点”和一个配备CXLGPU的“CXL-GPU节点”。CXL-Memory节点通过多个CXL内存扩展器提供大容量内存,而CXL-GPU节点通过多个CXL- GPU加速AI模型推理/训练。

为了构建这个AI集群,Panmnesia使用了它的两个主要产品:CXL IP和CXL交换机。首先,该公司的CXL IP嵌入到每个系统设备中,以启用CXL功能。由于CXL IP优化了设备之间的通信过程,因此它允许在不牺牲性能的情况下扩展内存,同时保持成本效益。接下来,使用Panmnesia的CXL 3.1交换机来互连上述各种类型的设备。

请注意,这不仅仅涉及物理连接。具体来说,CXL将GPU等加速器归类为第2类设备,将内存扩展器归类为第3类设备。为了将这些不同类型的设备互连在一起,交换机必须支持每种类型的设备所需的功能。由于该公司的CXL 3.1交换机满足这些要求,因此能够配置由不同类型设备组成的支持CXL的AI集群。此外,该公司的CXL 3.1交换机在增强跨多个节点(服务器)的可扩展性方面发挥着至关重要的作用。这是通过支持为高可扩展性而设计的CXL 3.1特性来实现的,例如多级交换和基于port的路由。

该公司表示:“这是世界上第一个采用CXL 3.1交换机的AI集群,也是世界上第一个采用CXL驱动的AI加速解决方案CXL- GPU的完整系统。”

CXL 3.1开关芯片也将在25年下半年提供给客户。

OCP全球峰会演示:在支持CXL的AI集群上加速前沿AI模型RAG

在OCP全球峰会上,Panmnesia在其支持CXL的AI集群上展示了全球首个RAG加速演示。RAG是下一代LLM(大规模语言模型),目前正在开发中,并被OpenAI和微软等公司使用。它可以成为当今行业的主要应用,因为它解决了现有LLM的固有局限性,即幻觉现象。

简单解释一下RAG的概念,它在包含大量数据的数据库中搜索与用户输入相关的信息,并使用搜索结果来提高LLM响应的准确性。

Panmnesia的一位代表表示:“我们的演示将显示,通过利用各种类型的CXL设备,Panmnesia的支持CXL的AI集群可以加速RAG应用程序的所有阶段。”

据该公司透露,通过CXL扩展的大内存可以有效地加速搜索过程,而CXL-GPU则可以加速LLM。

Panmensia相关人士表示:“通过CXL 3.1交换器和高性能CXL IP,可以连接数十台甚至100台设备,可以在数据中心层面有效地加速RAG等最新AI应用。通过参与OCP全球峰会,我们的目标是加强我们现有的全球合作伙伴关系,扩大我们的客户群。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30898

    浏览量

    269120
  • ChatGPT
    +关注

    关注

    29

    文章

    1561

    浏览量

    7683

原文标题:揭秘!世界第一个采用CXL 3.1交换机的AI集群

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    内存扩展CXL加速发展,繁荣AI存储

    和IO墙的瓶颈。它通过PCI Express的物理层,提供低延迟和高带宽的连接,旨在支持下一代数据中心的高性能计算和内存密集型工作负载。   CXL主要有CXL.io、CXL
    的头像 发表于 08-18 00:02 4879次阅读
    内存扩展<b class='flag-5'>CXL</b>加速发展,繁荣<b class='flag-5'>AI</b>存储

    AMD推出了Versal Premium Series Gen 2,这是业界第一个支持CXL 3.1和PCIe Gen6的FPGA平台。

    AMD推出了Versal Premium Series Gen 2,这是业界第一个支持CXL 3.1和PCIe Gen6的FPGA平台。   AMD为数据中心、航空航天、通信和T M市场设计了
    的头像 发表于 11-21 15:59 485次阅读
    AMD推出了Versal Premium Series Gen 2,这是业界<b class='flag-5'>第一个</b><b class='flag-5'>支持</b><b class='flag-5'>CXL</b> 3.1和PCIe Gen6的FPGA平台。

    韩国DB Hitek公司将拿下特斯拉10年电源芯片订单

    据国际媒体报道,韩国DB Hitek公司即将与电动汽车巨头特斯拉签署项长达十年的协议,专注于为特斯拉汽车制造电源管理芯片。   这款关键的电源管理芯片由家美国的
    的头像 发表于 10-08 16:02 1081次阅读

    聊天机器人初创公司Character.AI裁员至少5%

    聊天机器人初创企业Character.AI近期宣布了项裁员决定,涉及员工比例至少达到5%,主要受影响的是营销和招聘团队。此次调整被视为公司在面对市场变化时做出的战略优化,旨在更加高效
    的头像 发表于 08-30 15:37 321次阅读

    国数集联发布业界首款CXL多级网络交换机,IB时代的颠覆者

    今日,领先的高速互联芯片及方案设计厂商国数集联基于自主研发的CXL ( Compute Express Link )协议 IP,成功研发了业界第一CXL多级网络交换机(CXL
    的头像 发表于 07-31 16:35 862次阅读
    国数集联发布业界首款<b class='flag-5'>CXL</b>多级网络交换机,IB时代的颠覆者

    AI初创公司Etched获1.2亿美元A轮融资,加速专用AI芯片研发

    旧金山的家人工智能(AI初创公司Etched宣布,在最近完成的A轮融资中成功筹集了1.2亿美元的资金。这笔资金将主要用于进步开发其专用
    的头像 发表于 06-26 14:13 742次阅读

    韩国两大芯片公司寻求合并,以开发新AI芯片

    在人工智能芯片设计领域,韩国两大初创公司Rebellions Inc.和Sapeon Korea Inc.近日宣布计划合并,共同开发新AI
    的头像 发表于 06-18 16:10 617次阅读

    思科将向AI初创公司投资10亿美元

    思科近日宣布,计划向专注于“安全可靠”人工智能服务的初创公司投资10亿美元,以进步巩固其在AI技术领域的地位。作为这战略的
    的头像 发表于 06-07 09:39 580次阅读

    传软银正洽谈收购AI芯片初创公司

    据媒体最新报道,日本软银集团正就收购英国AI芯片初创公司Graphcore Ltd.展开深入谈判。Graphcore作为业内翘楚,其估值度高达28亿美元,其在
    的头像 发表于 05-13 11:19 562次阅读

    法国初创公司Mistral AI即将达成以60亿美元估值的融资协议

    法国初创公司Mistral AI近日在科技界掀起了股热潮,据可靠报道,该公司即将以惊人的60亿美元估值完成新
    的头像 发表于 05-10 09:47 380次阅读

    NVIDIA携手初创公司引领气候AI创新

    在应对气候变化这全球性挑战时,AI与可持续计算正成为关键工具。NVIDIA初创加速计划的成员公司Tomorrow.io、ClimaSens和north.io,均专注于极端天气预测领域
    的头像 发表于 03-27 10:29 392次阅读

    微软携手法国AI初创企业Mistral推动AI模型商业化

    微软近日与法国人工智能初创企业Mistral达成合作协议,旨在推动AI模型的商业化应用。据悉,微软将提供全方位支持,帮助这家成立仅10月的公司
    的头像 发表于 02-28 10:23 545次阅读

    中国AI初创公司竹间智能传停工6

    近期,中国出现了多家公司开工即停工的消息,其中包括AI初创企业竹间智慧科技(上海)有限公司。据21世纪经济报道,竹间智能因为业务需求减少,面临现金流压力和挑战,宣布将停工停产6
    的头像 发表于 02-27 18:07 728次阅读

    世界上第一个石墨烯半导体的“石墨烯”究竟是什么?

    有媒体报道称有研究团队创造了世界上第一个由石墨烯制成的功能半导体(Functional Graphene Semiconductor)。
    的头像 发表于 01-23 11:26 1248次阅读

    韩国拟建全球最大半导体产业集群

    韩国政府近日宣布了项宏伟的计划,拟在首尔南部建设名为“半导体巨型集群”的产业园区。这个园区将成为全球最大的半导体产业
    的头像 发表于 01-22 15:06 863次阅读