0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智算中心加速布局,上游计算、存储、互联都涉及哪些芯片技术

Carol Li 来源:电子发烧友 作者:李弯弯 2024-07-24 01:13 次阅读

电子发烧友网报道(文/李弯弯)智算中心是承载人工智能计算需求的基础设施,专门用于处理AI算法和模型所需的大量计算任务。与传统的数据中心和超算中心不同,智算中心更侧重于AI算力的提供,以满足日益增长的人工智能应用需求。

近期,中国各地纷纷加快数字基建项目的建设步伐,智算中心成为布局重点。从北京到四川,从宁夏到河南,多地智算中心项目相继开工或投入使用。国家统计局最新数据显示,我国算力基础设施建设已达到世界领先水平,智能算力规模占比提升至逾30%。

智算中心技术架构

智算中心的技术架构通常包含多个层次,从底层的硬件基础设施到上层的软件平台和算法服务,形成了一个完整的计算生态系统。

硬件基础设施层主要包括计算设备、存储系统和网络设施。计算设备包括高性能服务器、计算节点、GPU加速卡等,提供强大的计算能力和并行处理能力。这些设备是智算中心的核心组成部分,能够支持大规模数据处理和复杂的计算任务。

存储系统包括高速硬盘阵列、分布式文件系统、对象存储系统等,用于存储和管理海量数据。这些系统提供了高可靠性、高吞吐量和快速访问的存储解决方案,确保数据的安全性和可用性。

网络基础设施包括高速以太网、光纤网络、交换机、路由器等,支持数据传输和通信。这些设备提供了高带宽和低延迟的网络连接,以满足大规模数据传输和分布式计算的需求。

软件平台层包括算法和人工智能技术、大数据处理平台、AI使能软件和开发框架、云平台管理调度系统。算法和人工智能技术:包括机器学习算法、神经网络、图像处理和自然语言处理等,用于数据处理、机器学习、深度学习和模型训练等任务。这些算法和技术是智算中心实现智能计算的关键。

大数据处理平台:如Hadoop、Spark等,提供分布式和并行计算的能力,能够高效地处理大规模数据集。这些平台为智算中心提供了强大的数据处理和分析能力。

AI使能软件和开发框架:如CANN(华为昇腾AI计算架构)、MindSpore(华为全场景AI框架)等,为AI开发者提供便捷的开发环境和工具链,降低AI应用的开发门槛和成本。

云平台管理调度系统:如ModelArts(华为云AI开发平台)等,提供算力资源的统一管理和调度服务,实现算力资源的灵活配置和高效利用。

智算中心涉及的芯片及企业

从计算层面来看,智算中心以人工智能计算任务为主,是AI算力的核心基础设施。它采用专门的AI算力硬件,如GPU、NPU、TPU等,这些芯片擅长并行计算,能够高效处理AI算法中的大量简单矩阵运算任务。

智算服务器作为智算中心的主要算力硬件,通常采用“CPU+GPU”或“CPU+NPU”的异构计算架构,以充分发挥不同算力芯片在性能、成本和能耗上的优势。

这种强大的算力驱动AI模型对数据进行深度加工,源源不断产生各种智慧计算服务,面向全行业领域提供基于深度学习技术的人工智能算法能力、算法框架和相关接口

华为、天数智芯、摩尔线程、中科曙光、燧原科技英伟达英特尔AMD等都推出有相关的芯片。如,华为推出了昇腾系列AI芯片昇腾910和昇腾310等,这些芯片专为AI训练和推理设计,具有高性能和低功耗的特点。昇腾系列已广泛应用于数据中心、云服务和边缘计算等领域,为智算中心提供强大的算力支持。

英伟达推出了多款针对AI训练和推理的GPU产品,如A100、H100等。英特尔也推出了多款AI芯片产品,如Habana Labs的Gaudi系列芯片,旨在与英伟达竞争。AMD在AI芯片领域也有所布局,推出了MI系列GPU和APU产品。

从存储方面来看,智算中心需要存储海量的数据,包括结构化数据、非结构化数据等。这些数据是AI算法训练和推理的基础。因此,智算中心在存储方面需要具备高容量、高可靠性、高可用性等特点。

存储设备通常采用高性能的硬盘或固态硬盘,并配备冗余的存储架构,以确保数据的安全性和可访问性。一般而言,智算中心的主要算力硬件智算服务器,其DRAM容量和NAND容量通常是传统服务器的数倍。三星、美光、SK海力士等都有相关芯片都广泛应用于数据中心、云计算等领域,为智算中心提供高性能的存储解决方案。

网络互联方面,智算中心的设备互联首先依赖于硬件基础设施,包括高性能的交换机、路由器、无线产品等网络设备,以及用于连接服务器、存储设备等的光纤、网线等物理介质。为了实现设备间的高效互联,智算中心通常采用高速互联技术,如InfiniBand、RoCE(RDMA over Converged Ethernet)等。这些技术能够提供低延迟、高带宽的数据传输能力,满足AI算法对算力的需求。

在智算中心中,GPU是核心的计算单元。为了实现GPU之间的高效互联,通常采用NVLink等专用通信协议,以实现高速的P2P(点对点)互联带宽。NVLink是NVIDIA开发并推出的一种私有通信协议,它采用点对点结构、串列传输,可以达到数百GB/s的P2P互联带宽。

写在最后

智算中心作为智慧时代的基础设施,将在未来社会经济发展中发挥越来越重要的作用。随着技术的不断进步和应用场景的不断拓展,智算中心将迎来更加广阔的发展前景。而上游产业链为智算中心提供了必要的硬件和软件支持。这些产业链参与者的共同努力和协作,推动了智算中心计算能力的不断提升和发展。



声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4257

    浏览量

    85644
  • 计算
    +关注

    关注

    2

    文章

    444

    浏览量

    38725
  • 智算中心
    +关注

    关注

    0

    文章

    55

    浏览量

    1643
收藏 人收藏

    评论

    相关推荐

    计算与数据中心的关系

    计算与数据中心之间存在着密切且复杂的关系,它们相互依存、互相促进。 一、数据中心是云计算的基础设施 数据中心是一整套复杂的设施,用于传递、
    的头像 发表于 10-24 16:15 257次阅读

    一文读懂中心四大类型,深度解读应用与趋势

    随着《数字中国建设整体布局规划》的发布,中国正加速迈向数字化转型的新阶段。它不仅描绘了国家在数字经济、数字社会和数字政府建设方面的宏伟蓝图,还特别强调了力作为关键基础设施的重要性。
    的头像 发表于 10-17 08:05 451次阅读
    一文读懂<b class='flag-5'>算</b>力<b class='flag-5'>中心</b>四大类型,深度解读应用与趋势

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

    CPU计算单元设计 4.1 计算单元逻辑构成 4.2 数相浮点数的差异 4.3 算术逻辑单元 4.4 浮点数单元 4.5 指令的加载和存储单元 4.6 单指今多数据 4.7 矩阵加速
    发表于 10-15 22:08

    名单公布!【书籍评测活动NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架构分析

    力,在全球范围内,对于推动科技进步、经济发展及社会整体的运作具有至关重要的作用。随着信息技术的高速发展,高性能计算(HPC)和人工智能(AI)等技术在多个领域的应用变得日益广泛,芯片
    发表于 09-02 10:09

    如何理解云计算

    和硬件资源。 在数字化时代,互联网已经成为基础设施。云计算使得数据中心能够像一台计算机一样去工作。通过互联网将
    发表于 08-16 17:02

    IaaS+on+DPU(IoD)+下一代高性能力底座技术白皮书

    数据中心的第三颗“主力芯片”,主要通过其专用处理器优化数据中心的网络、存储、安全等处理性能,助力服务器运行效率显著提升,有效降低成本。因此,在新型数据
    发表于 07-24 15:32

    壁仞科技为中国移动呼和浩特智中心提供强大

    中心提供强大力。该项目成功上线运营,标志着双方在智能计算领域的深度合作迈出了坚实的步伐。   中国移动智中心(呼和浩特)属于全国型N节点
    的头像 发表于 07-05 17:16 1237次阅读

    云数据中心、智中心、超中心,有何区别?

    云数据中心、智中心和超中心是当前计算机领域中比较重要的研究方向,三者虽然
    的头像 发表于 06-22 08:27 4923次阅读
    云数据<b class='flag-5'>中心</b>、智<b class='flag-5'>算</b><b class='flag-5'>中心</b>、超<b class='flag-5'>算</b><b class='flag-5'>中心</b>,有何区别?

    “白地板”方案,智中心加速

    明德源能白地板方案,智中心加速
    的头像 发表于 06-21 11:54 729次阅读

    存内计算WTM2101编译工具链 资料

    存内计算是突破物理极限的下一代技术- AIGC等人工智能新兴产业的快速发展离不开力,力的基础是人工智能
    发表于 05-16 16:33

    NVIDIA 通过 CUDA-Q 平台为全球各地的量子计算中心提供加速

    德国、日本和波兰的超级计算机利用 Grace-Hopper 和量子-经典加速平台推进量子计算研究     德国汉堡 —— 国际超大会(
    发表于 05-13 15:21 182次阅读
    NVIDIA 通过 CUDA-Q 平台为全球各地的量子<b class='flag-5'>计算中心</b>提供<b class='flag-5'>加速</b>

    曙光携手鄂尔多斯共建绿色智中心

    系统、人工智能加速计算系统、大数据存储支撑系统、节点互联网络、基础配套系统为核心,编织起一个强大的力网络,每一环节都是智慧与科技的结晶,为
    的头像 发表于 05-09 09:59 665次阅读

    有方数据存储产品服务新疆移动智中心,推动数字生产力全面跃升

    近日,有方数据为新疆移动智中心项目建设提供了NeoVast 2300分布式海量存储系统、NeoHyper 2500分布式全闪存存储产品及服务,保障智
    的头像 发表于 04-28 14:10 512次阅读

    中心:数字经济发展的新引擎

    、建设与发展,并分析其对数字经济发展的影响。01、中心的定义与概述中心是指具备高性能计算、大规模
    的头像 发表于 04-13 08:27 1571次阅读
    <b class='flag-5'>算</b>力<b class='flag-5'>中心</b>:数字经济发展的新引擎

    SRAM存一体芯片的研究现状和发展趋势

    人工智能时代对计算芯片力和能效提出了极高要求。存一体芯片
    的头像 发表于 01-02 11:02 2294次阅读
    SRAM存<b class='flag-5'>算</b>一体<b class='flag-5'>芯片</b>的研究现状和发展趋势