玄铁C910是由平头哥设计并开源的高性能CPU,使用12nm工艺能跑到2.5GHZ,16核心,单位性能7.1 Coremark/MHz。基于开源的RISC-V指令集,主要面向对性能要求严格的边缘计算领域,如边缘服务器、边缘计算卡、高端机器视觉、高端视频监控、自动驾驶、移动智能终端、5G基站等。
C910采用了最先进的12级无序多问题超标量流水线,具有高频率、IPC和功率效率的特点。此外,它还支持硬件缓存一致性,每个集群包含1~4个内核,支持AXI4总线接口并包括一个设备一致性端口。在内存系统方面,C910使用了带有XMAE(XuanTie memory Attributes Extension)技术的Sv39虚拟地址系统。
在中断和调试方面,玄铁C910包括标准的CLINT和PLIC中断控制器,并支持与RV兼容的调试接口和性能监视器。
据统计,平均每6条指令就会遇到一条分支指令,所以控制冒险对系统性能的影响很大。那么分支预测技术就显得十分关键了,分支预测技术运用在取指阶段的流水线中,在高性能处理器中采用复杂的分支预测器,并且预测准确度能达到95%以上。下面我们会介绍玄铁C910处理器在分支预测上的处理。
玄铁C910处理器对普通分支指令采用的是64Kb的两级多路并行的分支预测器和1024表项的分支目标缓存器,对间接跳转指令还配有256表项的间接跳转分支预测器与12层的硬件返回地址堆栈,而且对于特殊的短循环的情况还配有短循环缓存。
玄铁C910的内存系统采用了带有XMAE(XuanTie memory Attributes Extension)技术的Sv39虚拟地址系统。此外,C910标配内存管理单元(MMU),兼容RISC-V SV39标准,这使得它可以有效地管理内存并运行诸如Linux等操作系统。
玄铁C910的研究方向
基于玄铁C910的三译码八执行的微架构,对内部微架构进行修改,主要涉及内容如下:
阿里的玄铁910火力全开,大约相当于2012年旗舰手机的处理器性能。
当然,因为处理器的多核心优化比较困难。日常主要应用很多时候要看单核心性能。2.5GHZ的玄铁910,单核心性能大约在500多Mhz的ARM11水平,大约相当于2008第二代iPhone3G的水平,不如2009年的iPhone3GS。
从性能看,虽然玄铁910的核心数很多,主频不低,但主要还是应用在移动和嵌入式领域。它距离高性能计算,还有很遥远的距离。
审核编辑:黄飞
-
cpu
+关注
关注
68文章
10816浏览量
210935 -
指令集
+关注
关注
0文章
221浏览量
23350 -
RISC-V
+关注
关注
44文章
2218浏览量
45973 -
玄铁910
+关注
关注
0文章
4浏览量
1699
发布评论请先 登录
相关推荐
评论