0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Kunpeng处理器组织及芯片架构

架构师技术联盟 来源:架构师技术联盟 2023-03-24 13:56 次阅读

鲲鹏处理器基于Arm架构。Arm是一种CPU架构,有别于IntelAMD CPU采用的CISC复杂指令集,Arm CPU采用RISC精简指令集(精简指令集计算机)。更多内容参考“华为鲲鹏处理器介绍”、“鲲鹏计算产业发展白皮书”和“华为鲲鹏生态研究框架”。 推荐阅读:‍1、‍华为鲲鹏处理器介绍 2、2023「企业智能分析与决策」实践合集

1、鲲鹏处理器的组织

Chip:芯片(Chip)是指有大规模集成电路的硅片,我们见过的CPU这种是最常见的芯片。一般几块硅片可以封装在一起组成一个芯片。

DIE:芯片的最小物理单元。Kunpeng 920封装了3个DIE,两个用来做计算,第三个用来做IO。

晶粒(die)是以半导体材料制作而成未经封装的一小块集成电路本体,该集成电路的既定功能就是在这一小片半导体上实现。通常情况下,集成电路是以大批方式,经光刻等多项步骤,制作在大片的半导体晶圆,然后再分割成方型小片,这一小片就称为晶粒,每个晶粒就是一个集成电路的复制品。

Core:真正的计算单元,我们在操作系统侧看到的“核”。

Cluster:若干个核(core)的集合。Kunpeng 920把4个core集合成为一个cluster,而一个DIE上有8个cluster。

SoC: System on chip,例如,Kunpeng 920除了CPu外,还集成了RoCE 网卡、SAS控制器和南桥。 SoC可以理解为一个芯片集成了一个系统,可以完成特定的一系列的工作,例如,CPU是大脑,SoC是不仅有大脑,还有手、脚、身体等等,这些手脚就相当于,GPU,网卡处理器,声卡处理器等。

2、Kunpeng 920芯片的架构

d13f8d1e-ca07-11ed-bfe3-dac502259ad0.jpg

1片SoC上包含3个DIE,2个计算DIE,1个IO DIE。 1个计算DIE中8个Cluster。 1个Cluster中4个Core。 因此一个kunpeng 920芯片中包含4*8*2=64个核。 计算DIE上的每一个core具有自己的L1和L2级Cache,所有的core共享L3级Cache。 IO DIE上集成有网络模块、PCle模块。 这些DIE在芯片内部通过高速内部总线进行连接。

3、芯片架构的系统安全&IMU

d1566480-ca07-11ed-bfe3-dac502259ad0.jpg

系统安全:支持安全启动,以及保证系统在可信环境内运行的一套软硬件方案。该方案由Secure Boot技术和ARM架构中的Trust Zone技术结合而成。 IMU ( lntelligent Management Unit )是Hi162x芯片内部的智能管理单元,完善ARM节点在数据中心的管理和控制,未来数据中心设备管理要求统一、智能和协同,遵循管理系统集中决策+节点执行监控,按照设备节点模型统一管理。 IMU作为数据中心的管理末端,协同BMC,完成数据中心的节点执行监控。 IMU可以覆盖的功能:RA5故障预处理以及错误记录上报、安全信任根、能效管理、芯片内部管理。

4、Kunpeng 920的其他子系统

d168d7fa-ca07-11ed-bfe3-dac502259ad0.jpg

鲲鹏处理器包含计算、存储、设备IO、中断以及虚拟化等子系统。 鲲鹏920含有两个CPU DIE、一个IO DIE、以及共8组DDR4channel,它们通过AMBA(Advanced MicrocontrollerBus Architecture)总线互联。

5、Kunpeng 920的IO子系统

鲲鹏处理器和IO子系统通过IO DIE进行扩展,支持soC片上加速器,如100G网卡、SAS控制器等。鲲鹏处理器同时支持基于PCle 4.0的设备扩展,可支持网卡、GPu等板卡。 为了方便软件编程,内部SoC上的高速设备也基于PCle,且可以通过PCle的配置空间进行配置。 各子系统 PCIE(含CCIX ),Hydra(多片互联),Network,Storage,HAC,ME,各自遵循行业标准,兼容软件接口规范,满足开源及演进要求。

d16e7796-ca07-11ed-bfe3-dac502259ad0.jpg

6、Kunpeng 920的中断子系统

d17ba09c-ca07-11ed-bfe3-dac502259ad0.jpg

1.在兼容ARM GIC规范的基础上,实现了线中断、消息中断支持。 (1)GlC ( Generic Interrupt Controller)指Arm定义的通用中断控制器。也是当前的芯片系统基于GIC规范提出的一种全局中断管理架构,它主要包括如下功能:

使能、禁用、选择所有的SGI、PPI、SPI以及LPI。

支持将输入的中断路由到任一指定的CPU内核。

支持中断优先级配置。

支持Arm AArch64安全化扩展。

持Arm AArch64虚拟化扩展。

(2)gicv3中,引入了消息中断,并且为之支持了LPI。分配了大量的中断号,用于LPIo对于LPI的实现,有2种方式,一种是访问redistributor提供的寄存器,一种是使用ITS。 (3)ITS( Hyper Interrupt Translation Service)功能是提供LPI中断重定向服务,将LPI中断路由到不同的CPU内核,其中中断和CPU内核的路由关系支持动态配置。 (4)LPI(Locality-specific Peripheral Interrupt):基于message的中断。 2.鲲鹏处理器引入中断收集再分发的概念。 3.鲲鹏920上还实现了华为公司的MBIGEN(message based interrupt generator)技术。

7、Kunpeng 920的网络子系统

1、网络子系统包括Network ICL和RoCE引擎两大部分。 2、Network lCL包括多个1Gbps~100Gbps以太网控制器,二层DCB、MAC地址表,多播表,VLAN过滤表,流表,中断,PCle化,具有完整的NIC引擎,可以在RoCE引擎关闭的情况下单独工作。 3、RoCE(RDMA over Converge Ethernet)是一种在以太网上采用RDMA(RemoteDirect Memory Access,远程直接内存访问)的网络互联技术。 4、华为鲲鹏920处理器使用的RoCE v2协议是由InfiniBand(IB)协议演进而来,既具有lnfiniBand网络的低时延、低CPU利用率等特点,又能够很好地兼容于Ethernet网络。

8、Kunpeng 920的SAS子系统

d1868e76-ca07-11ed-bfe3-dac502259ad0.jpg

1、提供2个X8 SAS 3.0控制器 (1)SAS(Serial Attached SCSI)即串行SCSI技术,一种磁盘连接技术。SAS控制器用于磁盘与内存之间进行交互。 (2)SAS控制器主要通过总线与CPU和内存进行交互,同时通过SERDES与硬盘进行连接。 (3)SAS控制器与设备连接方式有两种:直连和Expander连接。

直连表示SAS控制器的PHY与设备直接连接,不经过中间转换或扩展;.

Expander连接表示SAS控制器与设备之间通过扩展器进行连接

2、支持SAS 3.0,向下兼容SAS2.0和SAS1.0;支持SATA3.0,向下兼容SATA2.0和SATA1.0;SAS支持12G/6G/3G/1.5G四种速率,SATA支持6G/3G/1.5G速率,同时可以实现速率的自协商。 3、可以直接不经过Expander最大连接8个SAS盘或者SATA盘,两者可以混插; SAS盘分为SAS机械盘和SAS SSD盘,SAS盘是为满足高性能、高可靠性而设计,在内部驱动电机的可靠性、转速以及基板方面都与SATA盘有差异。 4、可以连接SAS Expander扩展更多磁盘。提供1个X2 SATA控制器; 5、支持SATA 3.0,向下兼容SATA 2.5;支持AHCI1.3,向下兼容AHCI 1.2;支持6G/3G/1.5G速率自协商; 6、支持直连两个SATA盘。 7、支持NOR Flash控制器,4个片选,NOR FLASH最大支持512K。 8、支持SPI Flash控制器,2个片选,SPI Flash最大支持32M。 9、支持NAND FLASH接口,4个片选。

9、Kunpeng 920的PCle子系统

d1992914-ca07-11ed-bfe3-dac502259ad0.jpg

1、支持PCle GEN1/2/3/4.0

Run at the 2.5G/5G/8G/16G。

x16 PCle控制器

嵌入式DMA引擎

PCle是一种高性能、通用的I/O互连接口,适用于各种计算和通信平台。鲲鹏920PCle子系统提供了实现PCle根联合体(Root Complex,RC)或端点(Endpoint,EP)应用程序的解决方案。 2、最多支持40个PCle Lane

3 PCle控制器

提供了实现PCIe根联合体或端点应用程序的解决方案

鲲鹏920 PCle子系统包含3个PCle Core,最多支持40个PCle Lane。每个PCle Core包括多个PCle端口。PCle Core0共享16个Lane。PCle Core1共享16个Lane。PCle Core2共享8个Lane。3个PCle Core均可作为根端口(Root Port,RP)使用。只有PCle Core1能作为EP端口。 3、硬件特性:SRIS(Separate Refclk Independent ssc)支持SR-IOv 4、支持共享虚拟内存 5、支持CCIX 6、支持P2P(Peer to Peer)。不同控制器之间的对等流量

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19076

    浏览量

    228679
  • 集成电路
    +关注

    关注

    5375

    文章

    11281

    浏览量

    360089
  • 半导体材料
    +关注

    关注

    11

    文章

    516

    浏览量

    29460
  • 芯片架构
    +关注

    关注

    1

    文章

    30

    浏览量

    14542

原文标题:Kunpeng处理器组织及芯片架构

文章出处:【微信号:架构师技术联盟,微信公众号:架构师技术联盟】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    华为首次发布基于ARM架构处理器芯片

    今年10月,华为发布的两款AI芯片:昇腾910和昇腾310是华为AI的核心武器,用来武装企业端——华为云EI;而今日华为发布了最新款的基于ARM架构处理器芯片
    的头像 发表于 12-25 10:04 7555次阅读

    MIT突破传统架构,挑战36核心处理器

    麻省理工学院采用新架构开发出一款36核的处理器芯片原型。
    发表于 07-10 09:21 1000次阅读

    浅谈ARM处理器架构

    ,新的 Cortex-M处理器家族设计的非常容易使用。因此,ARM 微控制处理器在单片机和深度嵌入式系统市场非常成功和受欢迎。二、ARM三个系列处理器特点三、目前,有哪些
    发表于 08-18 12:04

    存储是如何组织的?是如何与处理器总线连接的?

    第一套在8086的微计算机系统中,存储是如何组织的?是如何与处理器总线连接的?#BHE信号起什么作用?答:8086 为 16 位处理器,可访问 1M 字节的存储
    发表于 07-26 06:06

    谈谈嵌入式处理器的体系架构

    当我们谈及嵌入式处理器的体系架构时,一般都是想到Intel的X86架构和ARM公司的ARM架构。X86架构和ARM
    发表于 12-15 06:59

    ARM微处理器的特点及其架构解析

    - 基于 ARMv5 架构的常用处理器• ARM7™ 系列- 面向通用应用的经典处理器ARM 经典处理器适用于那些希望在新应用中使用经过市场验证的技术的
    发表于 04-13 12:08

    多核处理器架构及调试

      认识多核基本架构   多核处理器在同一个芯片中植入了多个处理器引擎,这就可以提供更高的CPU性能、功能特性和分区能力。一般说来,多核有两种实现形式。
    发表于 08-26 18:08 1316次阅读

    ARM公版架构 真的是麒麟处理器的槽点吗?

    只要出现麒麟处理器,那么必定会有很多人纠结于其使用的是ARM的公版架构,或者用之作为麒麟处理器的弱点进行攻击。那么,在笔者看来,拿采用ARM公版架构来否认麒麟
    发表于 01-04 16:24 3039次阅读
    ARM公版<b class='flag-5'>架构</b> 真的是麒麟<b class='flag-5'>处理器</b>的槽点吗?

    华为推出基于ARM架构的服务处理器鲲鹏920

    1月7日,华为宣布推出业界最高性能基于ARM架构的服务处理器鲲鹏920(Kunpeng 920),以及基于鲲鹏920的TaiShan服务
    的头像 发表于 01-10 16:03 6624次阅读

    音频处理器架构_音频处理器的延时怎么调整

    本文主要阐述了音频处理器架构与音频处理器延时的调整方法。
    发表于 04-09 11:01 5209次阅读

    处理器架构与指令集

    大家天天都在使用手机,你知道你的手机使用的什么处理器处理器又是何种架构呢?今天笔者就来谈谈处理器架构和指令集。 我们知道一台手机最重要的
    的头像 发表于 04-26 11:40 3526次阅读
    <b class='flag-5'>处理器</b><b class='flag-5'>架构</b>与指令集

    m3芯片与m1处理器参数对比

    ,它是一款基于ARM架构芯片,而M1处理器是苹果公司在2020年推出的首款基于ARM架构芯片,它是苹果公司自主设计的
    的头像 发表于 08-16 11:33 1w次阅读

    简单认识MIPS架构处理器

    无互锁流水级微处理器 (Microprocessors without Interlocked Pipeline Stages,MIPS) 是流行的 RISC 架构处理器之一。其原理是尽量利用软件
    的头像 发表于 11-29 09:14 1690次阅读
    简单认识MIPS<b class='flag-5'>架构</b><b class='flag-5'>处理器</b>

    处理器的指令集架构介绍

    处理器的指令集架构(Instruction Set Architecture,ISA)是计算机体系结构中至关重要的部分,它定义了微处理器能够执行的操作和指令的集合,以及这些指令如何被组织
    的头像 发表于 08-22 10:53 722次阅读

    ARM处理器的寄存组织及功能

    ARM处理器的寄存组织是其核心架构的重要组成部分,对于理解ARM处理器的运行机制和性能特点具有重要意义。以下是对ARM
    的头像 发表于 09-10 11:11 777次阅读