0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

怎么计算ARM核CPU的算力?

汽车电子技术 来源:宅学部落 作者: wit 2023-02-17 09:51 次阅读

在同构处理器时代,我们一般使用主频来衡量一个处理器的性能。而到了异构处理器时代,随着人工智能、大数据、多媒体编解码对海量数据的计算需求,我们一般使用浮点运算能力来衡量一个处理器的性能。

每秒浮点运算次数(Floating Point Operations Per Second,FLOPS),又称为每秒峰值速度。浮点运算在科研领域大量使用,现在的CPU除了支持整数运算,一般还支持浮点运算,有专门的浮点运算单元,FLOPS测量的就是处理器的浮点运算能力。FLOPS的计算公式如下:

浮点运算能力 = 处理器核数 * 每周期浮点运算次数 * 处理器主频

除了FLOPS,还有MFLOPS、GFLOPS、TFLOPS、PFLOPS、EFLOPS等单位,它们之间的换算关系如下。

MFLOPS:megaFLOPS,每秒10^6次浮点运算,相当于每秒一百万次浮点运算
GFLOPS:gigaFLOPS,每秒10^9次浮点运算,相当于每秒十亿次浮点运算
TFLOPSteraFLOPS,每秒10^12次浮点运算,相当于每秒一万亿次浮点运算
PFLOPS:petaFLOPS,每秒10^15次浮点运算,相当于每秒一千万亿次浮点运算
EFLOPS:exaFLOPS,每秒10^18次浮点运算,相当于每秒一百亿亿次浮点运算

1946年,世界上第一台通用计算机诞生于美国宾夕法尼亚大学,运算速度为300FLOPS。早期树莓派使用的博通CM2708 ARM11处理器,主频为1GHz,运算速度为316.56MFLOPS。2011年发射的“好奇号”火星探测器,使用的是IBM的PowerPC架构的处理器,主频为200MHz,运算速度相当于Intel 80386处理器的水平,差不多在0.4GFLOPS上下。

Intel的Core-i5-4210U处理器运算速度为36GFLOPS,Microsoft Xbox 360运算速度为240GFLOS,ARM Mali-T760 GPU主频600MHz,运算速度为326GFLOPS,NVIDIA GeForce 840M运算速度为700GFLOPS,相当于0.7TFLOPS。

“吃鸡游戏 ”绝地求生的标配显卡NVIDIA Geforce GTX 1060运算速度为3.85TFLOPS,GTX 1080 Ti运算速度为11.5TFLOPS。最新的NVIDIA Tesla V100显卡,运算速度为125TFLOPS,是世界上第一个突破100万亿次的深度学习GPU。

2008年,中国第一台闯入世界前10的超级计算机:中国“曙光”5000A超级计算机,计算速度为230TFLOPS,相当于0.23PFLOPS。我国首台千万亿次的超级计算机“天河一号”运算速度为2.566PFLOPS,美国橡树岭国家实验室的“泰坦”超级计算机算力为17.59PFLOPS,“天河二号”的运算速度为33.86PFLOPS,无锡“神威·太湖之光”的运算速度为93.01PFLOPS,霸占超级计算机榜首多年。2019年11月18日发布的排在第一的是IBM设计的Summit超级计算机,运算速度为154.5PFLOPS,即0.1545EFLOPS。2020年11月最新发布的超级计算机排行榜发布,Summit被日本的Fugaku富岳反超,富岳超级计算机是首次采用全ARM架构的超级计算机,其中包含了7,299,072个core,算力为442PFLOPS,相当于0.442EFLOPS,算力差不多是summit的三倍。

2013年比特币的全网算力为1EFLOPS,2018年5月,比特币的全网算力为35EFLOPS。2020年5月,比特币的全网算力峰值高达70EFLOPS以上,随着比特币价格的上下波动,比特币的全网挖矿算力也随之上下起伏。

Google公司在2017年发布的TPU v2处理器运算能力达到了180 TFLOPS,2019年发布的TPU v3版本,算力是420 TFLOPS。华为2018年发布的昇腾910 AI处理器,CPU算力达到640 TOPS@INT8,浮点运算能力为320 TFLOPS@FP16。这些都是服务器端的CPU算力,不用考虑功耗,所以算力都很高。

为了对比一下算力差距,将单位统一到 GFLOPS 后的数据如下:

图片

图片

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19714

    浏览量

    232729
  • 人工智能
    +关注

    关注

    1804

    文章

    48406

    浏览量

    244655
  • 大数据
    +关注

    关注

    64

    文章

    8941

    浏览量

    139068
收藏 人收藏

    相关推荐

    ”的分层定义-初级

    ”(Computility,也被称为计算能力或计算力)通常而言是指计算机、服务器、GPU或其他硬件设备执行
    的头像 发表于 07-27 14:02 3921次阅读
    “<b class='flag-5'>算</b><b class='flag-5'>力</b>”的分层定义-初级<b class='flag-5'>算</b><b class='flag-5'>力</b>

    名单公布!【书籍评测活动NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架构分析

    社会资源和资本力量关注芯片的发展,希望我们的国家能够更独立自主地设计制造高性能芯片。 内容简介: 本书介绍了超级计算
    发表于 09-02 10:09

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

    本帖最后由 1653149838.791300 于 2024-10-16 22:19 编辑 感谢平台提供的书籍,厚厚的一本,很有分量,感谢作者的倾力付出成书。 本书主要讲芯片CPU
    发表于 10-15 22:08

    进迭时空 K1 系列 8 64 位 RISC - V AI CPU 芯片介绍

    、云电脑、智能机器人、工业控制、边缘计算机等领域。二、具体特性(一)卓越的 CPU 性能核心配置 :具有 8 RISC - V AI CPU,能够提供 50KD MIPS
    发表于 01-06 17:37

    rx580,rx580显卡,rx588,rx588显卡 精选资料分享

    已下是rx580显卡9-11 Mh 没有开启计算模式,挖几分种重启自动开启,计算模式只支持WIN1022-28 Mh 原版BIOS,开启时序,并设置超频29-32 Mh 正常
    发表于 07-23 06:59

    数据、算法和其实现载体是什么

    背景介绍数据、算法和是人工智能技术的三大要素。其中,体现着人工智能(AI)技术具体实现的能力,实现载体主要有CPU、GPU、FPGA
    发表于 07-26 06:47

    BananaPi BPI-M2S 是新设计的一款单板计算机,采用Amlogic A311D,NPU for AI 支持 5.0 TOPS,板载4G内存和16gb eMMC存储

    ​ BananaPi BPI-M2S 是香蕉派开源社区2021新设计的一款单板计算机,采用Amlogic A311D四ARM Cortex-A73和双
    发表于 09-30 12:41

    BananaPi BPI-M2S 采用Amlogic A311D,NPU for AI 支持 5.0 TOPS,板载4G内存和16gb eMMC存储

    ​ BananaPi BPI-M2S 是香蕉派开源社区2021新设计的一款单板计算机,采用Amlogic A311D四ARM Cortex-A73和双
    发表于 09-30 14:37

    Xilinx Zynq7035指标

    目的本文介绍广州星嵌DSP C6657+Xilinx Zynq7035平台下Xilinx Zynq7035指标。基本概念FLOPs/FLOPSFLOPs,Floating Point
    发表于 12-15 21:19

    何为

    由基于CPU芯片的服务器所提供的,主要用于基础通用计算。日常提到的云计算、边缘计算等都属于基
    的头像 发表于 05-13 14:36 8538次阅读

    什么是如何衡量?

    简而言之就是设备的计算能力(Computing Power)。小至手机、PC,大到超级计算机,支撑各种软硬件的正常应用,为生活、生产提供计算能力。以PC而言,搭载的CPU、显卡、内存配
    的头像 发表于 11-02 10:23 1.8w次阅读

    GPU是显卡吗 cpu和gpu哪个

    很大的区别,因此它们的计算能力也不同。 首先,我们来看一下CPU(中央处理器)的CPU是一种通用处理器,它被设计用于处理各种不同类型的
    的头像 发表于 01-10 15:45 6182次阅读

    中心的如何衡量?

    (ComputationalPower)是指智中心通过其内部的计算设备(如CPU、GPU、AI芯片等)对数据进行处理和计算的能力。它体现了智
    的头像 发表于 01-16 14:03 1451次阅读
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    云 GPU 加速计算:突破传统瓶颈的利刃

    ,犹如一把利刃,成功突破了传统的瓶颈。 传统的 CPU 计算在面对大规模并行计算任务时,往往显得力不从心。
    的头像 发表于 02-17 10:36 187次阅读