0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从0开始学ARM-CPU原理

璟琰乀 来源:一口Linux 作者:一口Linux 2020-11-23 11:56 次阅读

一、计算机架构在了解计算机架构之前,我们先来认识几位对计算机的发明做出关键共享的几位大佬。

1. 巴贝奇机械计算机之父,英国贵族,曾孤军奋战下造出的第一台差分机,运算精度达到了6位小数,后来又设计了20位精度的差分机,其设计理念已经达到了机械设计登峰造极的境界。

1985~1991年,伦敦科学博物馆为了纪念巴贝奇诞辰200周年,根据其1849年的设计,用纯19世纪的技术成功造出了差分机2号。

巴贝奇堪称上个世纪最强大脑,他的大脑现保存在英国科学博物馆。

程序员的祖师奶奶Ada正是在和巴贝奇共同工作时提出了程序循环分支等等我们现在都习以为常的编程理念。

差分机

2. 图灵被称为计算机科学之父,人工智能之父。1931年图灵进入剑桥大学国王学院,毕业后到美国普林斯顿大学攻读博士学位,第二次世界大战爆发后回到剑桥,后曾协助军方破解德国的著名密码系统Enigma,帮助盟军取得了二战的胜利。图灵对于人工智能的发展有诸多贡献,提出了一种用于判定机器是否具有智能的试验方法,即图灵试验,至今,每年都有试验的比赛。

图灵在战时服务的机构于1943年研制成功的CO-LOSSUS(巨人)机,这台机器的设计采用了图灵提出的某些概念。它用了1500个电子管,采用了光电管阅读器;利用穿孔纸带输入;并采用了电子管双稳态线路,执行计数、二进制算术及布尔代数逻辑运算,巨人机共生产了10台,用它们出色地完成了密码破译工作。

强烈推荐这部根据图灵生平改编的电影《模仿游戏》,一起感受下这个绝世天才不平凡的一生。

模仿游戏

3. 冯诺依曼-《计算机与人脑》计算机架构主要有两种:哈佛架构、冯诺依曼架构。现代计算机,大部分都是基于冯诺依曼体系结构。

我个人认为冯诺依曼应该是上个世纪「最聪明的人,没有之一」。

他的个人成就在此就不说了,大家可以自行搜索,很多成就,一口君连名字都看不懂,只有博弈论还勉强知道是啥意思。

本文只讨论大神对计算机的贡献【其实计算机并不是大神的最厉害的成就,而且他也并没有花太多时间精力在计算机的研究上】。

1955年10月,诺伊曼,被查出患有癌症。而他几乎是在他生命的最后时刻,于临终的病榻上撰写了关于人的神经系统与计算机关系的讲稿。1958年,他的讲稿以《计算机与人脑》为题出版。

计算机与人脑

诺依曼从数学的角度,主要是从逻辑和统计数学的角度,讨论了神经系统的刺激——反应和记忆等问题,提出神经系统具有数字部分和模拟部分两方面的特征,探讨了神经系统的控制及逻辑结构。

4. 冯诺依曼架构冯诺依曼的核心是:「存储程序,顺序执行」,规定计算机必须具有如下功能:

把需要的程序和数据送至计算机中;

必须具有长期记忆程序、数据、中间结果及最终运算结果的能力;

能够完成各种算术、逻辑运算和数据传送等数据加工处理的能力;

能够根据需要控制程序走向,并能根据指令控制机器的各部件协调操作;

能够按照要求将处理结果输出给用户

冯诺依曼架构

5. 哈佛架构冯诺依曼结构和哈佛结构是有区别的。

冯诺依曼结构是程序存储区和数据存储器都是可以放到内存中,统一编码的,而哈弗结构是分开编址的。

哈佛架构

6. 哪些处理器是哈佛架构、冯诺依曼架构?「哈佛架构」

MCU单片机)几乎都是用哈佛结构,譬如广泛使用的51单片机、典型的STM32单片机(核心是ARM Cortex-M系列的)都是哈佛结构。

「冯诺依曼架构」

PC和服务器芯片(譬如Intel AMD),ARM Cortex-A系列嵌入式芯片(譬如核心是ARM Cortex-A9的三星exynos-4412,譬如华为的麒麟970手机芯片)等都是冯诺依曼结构。这些系统都需要大量内存,所以工作内存都是DRAM,因为他们更适合使用冯诺依曼系统。

「混合结构」

实际上现代的CPU(准确说叫SoC)基本都不是纯粹的哈佛结构或冯诺依曼机构,而都是混合结构的。

比如三星exynos 4412,使用ARM的Cortex-A9核心。基于exynos 4412开发板上都配备了1024MB的DDR SDRAM,和8GB的EMMC。

正常工作时所有的程序和数据都从EMMC中加载到DDR中,也就是说不管你是指令还是数据,存储都是在EMMC中,运行时都在DDR中,再通过cache和寄存器送给CPU去加工处理。这就是典型的冯诺依曼系统。

但是,exynos 4412内部仍然有一定容量的64KB irom和64KB iram,这些irom和iram是用于SoC引导和启动的,芯片上电后首先会执行内部irom中固化的代码,其实执行这些代码时4412就好像一个MCU一样,irom就是他的flash,iram就是他的SRAM,这又是典型的哈佛结构。

这就是混合式结构设计,而非纯粹设计。之所以采用混合式设计其实就是为了各取所长而已。

不管白猫黑猫,解决问题就是好猫。

二、计算机组成计算机系统=硬件系统+软件系统 硬件是计算机系统的物质基础,软件是计算机系统的灵魂。硬件和软件是相辅相成的,不可分割的整体。

计算机组成

1)。输入设备输入设备的任务是把人们编好的程序和原始数据送到计算机中去,并且将它们转换成计算机内部所能识别和接受的信息方式。常用的有键盘、鼠标、扫描仪等。

2)。输出设备输出设备的任务是将计算机的处理结果以人或其他设备所能接受的形式送出计算机。常用的有显示器、打印机、绘图仪等。

3)。存储器、CPU见第三节

4)。 计算机的总线结构将各大基本部件,按某种方式连接起来就构成了计算机的硬件系统。

系统总线包含有三种不同功能的总线,即数据总线DB(Data Bus)、地址总线AB(Address Bus)和控制总线CB(Control Bus)。

数据总线DB 用于传送数据信息。数据总线的位数是微型计算机的一个重要指标,通常与微处理的字长相一致。例如Intel 8086微处理器字长16位,其数据总线宽度也是16位。

地址总线AB 专门用来传送地址的。地址总线的位数决定了CPU可直接寻址的内存空间大小,比如8位微机的地址总线为16位,则其最大可寻址空间为216=64KB,16位微型机的地址总线为20位,其可寻址空间为220=1MB。控制总线CB 用来传送控制信号和时序信号。控制信号中,有的是微处理器送往存储器和I/O接口电路的,如读/写信号,片选信号、中断响应信号等;也有是其它部件反馈给CPU的,比如:中断申请信号、复位信号、总线请求信号、限备就绪信号等。控制总线的具体情况取决于CPU。

在这里插入图片描述

三、 CPU工作原理CPU内部主要包括运算器和控制器

指令

1) 存储器存储器是用来存放程序和数据的部件,它是一个记忆装置,也是计算机能够实现“存储程序控制”的基础。

包括:Cache、主存储器、辅助存储器。

「高速缓冲存储器(Cache)」CPU可以直接访问,用来存放当前正在执行的程序中的活跃部分,以便快速地向CPU提供指令和数据。

「主存储器」可由CPU直接访问,用来存放当前正在执行的程序和数据。

「辅助存储器」设置在主机外部,CPU不能直接访问,用来存放暂时不参与运行的程序和数据,需要时再传送到主存。

存储器

2) 运算器运算器的核心是算术逻辑运算部件ALU,还包括若干个寄存器(如累加寄存器、暂存器等)。

ALU可以执行算术运算(包括加减乘数等基本运算及其附加运算)和逻辑运算(包括移位、逻辑测试或两个值比较)。相对控制单元而言,运算器接受控制单元的命令而进行动作,即运算单元所进行的全部操作都是由控制单元发出的控制信号来指挥的,所以它是执行部件。

运算器

3) 控制器控制单元是整个CPU的指挥控制中心,由程序计数器PC(Program Counter), 指令寄存器IR(Instruction Register)、指令译码器ID(Instruction Decoder)和操作控制器OC(Operation Controller)等组成,对协调整个电脑有序工作极为重要。

它根据用户预先编好的程序,依次从存储器中取出各条指令,放在指令寄存器IR中,通过指令译码(分析)确定应该进行什么操作,然后通过操作控制器OC,按确定的时序,向相应的部件发出微操作控制信号。操作控制器OC中主要包括节拍脉冲发生器、控制矩阵、时钟脉冲发生器、复位电路和启停电路等控制逻辑。

控制器

4) CPU的运行原理总结控制单元在时序脉冲的作用下,将指令计数器里所指向的指令地址(这个地址是在内存里的)送到地址总线上去,然后CPU将这个地址里的指令读到指令寄存器进行译码。

对于执行指令过程中所需要用到的数据,会将数据地址也送到地址总线,然后CPU把数据读到CPU的内部存储单元(就是内部寄存器)暂存起来,最后命令运算单元对数据进行处理加工。

周而复始,一直这样执行下去。

5) 指令执行过程一条指令的执行通常包括以下4个步骤:

指令执行过程

1、取指令:CPU的控制器从内存读取一条指令并放入指令寄存器。2、指令译码:指令寄存器中的指令经过译码,决定该指令应进行何种操作(就是指令里的操作码)、操作数在哪里(操作数的地址)。3、 执行指令,分两个阶段“取操作数”和“进行运算”。4、 修改指令计数器,决定下一条指令的地址。

6) ARM技术特征ARM的成功,一方面得益于它独特的公司运作模式,另一方面,当然来自于ARM处理器自身的优良性能。作为一种先进的RISC处理器,ARM处理器有如下特点。

体积小、低功耗、低成本、高性能。

支持Thumb(16位)/ARM(32位)双指令集,能很好地兼容8位/16位器件。

大量使用寄存器,指令执行速度更快。

大多数数据操作都在寄存器中完成。

寻址方式灵活简单,执行效率高。

指令长度固定。此处有必要讲解一下RISC微处理器的概念及其与CISC微处理器的区别。

7) ARM体系架构的发展体系架构的定义:体系架构定义了指令集(ISA)和基于这一体系架构下处理器的编程模型。基于同种体系架构可以有多种处理器,每个处理器性能不同,所面向的应用不同,每个处理器的实现都要遵循这一体系结构。ARM体系架构为嵌入系统发展商提供很高的系统性能,同时保持优异的功耗和效率。

ARM体系架构为满足ARM合作者及设计领域的一般需求正稳步发展。目前,ARM体系架构共定义了8个版本,从版本1到版本8,ARM体系的指令集功能不断扩大,不同系列的ARM处理器,性能差别很大,应用范围和对象也不尽相同,但是,如果是相同的ARM体系架构,那么基于它们的应用软件是兼容的。

下面我们简单介绍下 V7/V8架构。

v7架构

ARMv7架构是在ARMv6架构的基础上诞生的。该架构采用了Thumb-2技术,它是在ARM的Thumb代码压缩技术的基础上发展起来的,并且保持了对现存ARM解决方案的完整的代码兼容性。Thumb-2技术比纯32位代码少使用31%的内存,减小了系统开销,同时能够提供比已有的基于Thumb技术的解决方案高出38%的性能。ARMV7架构还采用了NEON技术,将DSP和媒体处理能力提高了近4倍。并支持改良的浮点运算,满足下一代3D图形、游戏物理应用及传统嵌入式控制应用的需求。

v8架构

ARMv8架构是在32位ARM架构上进行开发的,将被首先用于对扩展虚拟地址和64位数据处理技术有更高要求的产品领域,如企业应用、高档消费电子产品。ARMv8架构包含两个执行状态:AArch64和AArch32。AArch64执行状态针对64位处理技术,引入了一个全新指令集A64,可以存取大虚拟地址空间;而AArch32执行状态将支持现有的ARM指令集。目前的ARMv7架构的主要特性都将在ARMv8架构中得以保留或进一步拓展,如TrustZone技术、虚拟化技术及NEON advanced SIMD技术等。

8) ARM 微处理器架构ARM内核采用RISC体系架构。ARM体系架构的主要特征如下。

采用大量的寄存器,它们都可以用于多种用途。

采用Load/Store体系架构。

每条指令都条件执行。

采用多寄存器的Load/Store指令。

能够在单时钟周期执行的单条指令内完成一项普通的移位操作和一项普通的ALU操作。

通过协处理器指令集来扩展ARM指令集,包括在编程模式中增加了新的寄存器和数据类型。

如果把Thumb指令集也当做ARM体系架构的一部分,那么在Thumb体系架构中还可以高密度16位压缩形式表示指令集。

9) ARM指令ARM指令是RISC(Reduced Instruction Set Computing),即精简执令运算集,RISC把着眼点放在如何使计算机的结构更加简单和如何使计算机的处理速度更加快速上。RISC选取了使用频率最高的简单指令,抛弃复杂指令,固定指令长度,减少指令格式和寻址方式,不用或少用微码控制。这些特点使得RISC非常适合嵌入式处理器。

RISC可以实现以相对少的晶体管设计出极快的微处理器。通过研究发现,只有大约20%的指令是最常用的,把处理器能执行的指令数目减少到最低限度,对它们的执行过行优化,就可以极大地提高处理的工作速度。

一般来说,RISC处理器比同等的CISC(Complex Instruction Set Computer,复杂指令集计算机)处理器要快50%-75%,同时RISC处理器更容易设计和纠错。

一般指令格式如下:

指令格式

「操作码:」操作码就是汇编语言里的mov,add,jmp等符号码;

「操作数地址:」用于说明该指令需要的操作数所在的地方,是在内存里还是在CPU的内部寄存器里。

实际上的机器指令格式远比这个复杂,下图是常用的ARM指令格式:

ARM 指令格式

关于这些机器指令格式,后面我们会挑选其中几个分析,对于我们大部分读者来说,没有必要花太多精力去研究这些机器指令,只需要大概了解即可。

关于CPU我们从宏观上把握到这个程度就OK了,后面我们会逐步进入后续阶段的学习,介绍ARM寄存器模式、异常、寻址、汇编指令,以及C代码中嵌入的汇编语言的写法。

四、SOCSOC:系统芯片是一个将计算机或其他电子系统集成单一芯片的集成电路。系统芯片可以处理数字信号、模拟信号、混合信号甚至更高频率的信号。

从狭义角度讲,它是信息系统核心的芯片集成,是将系统关键部件集成在一块芯片上; 从广义角度讲, SoC是一个微小型系统,如果说中央处理器(CPU)是大脑,那么SoC就是包括大脑、心脏、眼睛和手的系统。

1. ARM base Soc嵌入式系统中常常要使用系统芯片。系统芯片的集成规模很大,一般达到几百万门到几千万门。SOC相对比较灵活,它可以将arm架构的处理器与一些专用的外围芯片集成到一起,组成一个系统。

下图是一个典型的基于ARM架构的SOC架构图。

ARM base Soc

一个典型的基于ARM的Soc架构通常包含以下几个主要部件:

ARM Processor core 处理器核

Clocks and Reset Controller 时钟和复位电路

Interrupt Controller 中断控制器

ARM Propherals 外部设备

GPIO

DMA Port

External Memory Interface 外部内存接口

On chip RAM 偏上RAM

AHB、APB总线

其实现有的ARM处理器如Hisi-3507、exynos-4412等处理器都是一个SOC系统,尤其是应用处理器它集成了许多外围的器件,为执行更复杂的任务、更复杂的应用提供了强大的支持。

该架构是我们理解汇编指令和编写裸机程序的基石。

当我们拿到一个新的SOC的datasheet,首先就要根据这个架构,来查看SOC的「RAM空间、时钟频率、包括哪些外部设备的控制器,各个外设控制器的操作原理,各个外设对GPIO的引脚复用情况、各个控制器的SFR地址、中断控制器是如何管理众多中断源的等等」。

2. 三星 Exynos 44122012年初,三星正式推出了自家的首款四核移动处理器Exynos4412。

下面三星的exynos 4412的SOC。

Exynos 4412 SCP结构框图

如上图所示,exynos 4412主要包括以下模块:

4(quad)个Cortex-A9处理器

1MB的 L2 Cache

Interrupt Controller 中断控制器,管理所有的中断源

Interrupt Combiner 中断控制器,管理soc内的一些中断源

NEON ARM 架构处理器扩展结构,旨在通过加速多媒体(video/audio)编解码,用户界面,2D/3D图形及游戏来提高人对多媒体的体验

DRAM、Internal RAM、NAND Flash、SROM Controller 各种存储设备的控制器

SDIO、USBI2CUART、SPI等总线

RTC、Watchdog Timer

Audio Subsystem 声音子系统

IIS(Integrate Interface of Sound)接口 ,集成语音接口

Power Management电源管理

Multimedia Block 多媒体模块

这款新Exynos四核处理器,拥有32nm HKMG(高K金属栅极技术)制程,支持双通道LPDDR21066。三星公司已将这颗图形处理器主频由此前的266MHz提升至400MHz,新闻稿指出其会比现有的双核机型整体性能提升60%,图像处理能力提升50%。

三星智能手机Galaxy S III手机就采用了Exynos4412处理器。

学习ARM就必须深刻了解soc架构,官方提供的datasheet是我们学习ARM、编写驱动程序的基石,该手册内容比较多,我们并不需要每一章都掌握,用到哪个地方,我们就去学习即可。责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9111

    浏览量

    368115
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10882

    浏览量

    212273
  • 计算机
    +关注

    关注

    19

    文章

    7520

    浏览量

    88266
收藏 人收藏

    评论

    相关推荐

    英伟达进军ARM架构CPU市场,预计2025年推出新产品线

    近日,英伟达公司传出了一则令人瞩目的消息:该公司正在积极开发一款基于ARM架构的新型CPU。这一消息不仅证实了之前业界关于英伟达ARM PC CPU的传言,更展示了英伟达在
    的头像 发表于 11-11 15:33 350次阅读

    gd32vf103 timer内部计数器是自增的,位宽64位,溢出后是0开始吗?

    timer内部计数器是自增的,位宽64位,溢出后是0开始吗?有知道的小伙伴吗?官方参考手册也没有说明。
    发表于 09-27 07:09

    Arm CPU如何推动AI创新

    在 COMPUTEX 2024 展前,Arm 首席执行官 Rene Haas 分享了公司将如何实现到 2025 年底让超过 1,000 亿台基于 Arm 架构设备可用于云端到边缘侧的人工智能 (AI)。
    的头像 发表于 09-14 09:49 453次阅读

    ARM处理器和CPU有什么区别

    ARM处理器和CPU(中央处理器)之间的关系及区别,可以多个维度进行深入探讨。首先,需要明确的是,ARM处理器并非一种独立的CPU类型,而
    的头像 发表于 09-10 11:24 1542次阅读

    STM32到基于Arm的MSPM0的迁移指南

    电子发烧友网站提供《STM32到基于Arm的MSPM0的迁移指南.pdf》资料免费下载
    发表于 09-07 11:31 0次下载
    <b class='flag-5'>从</b>STM32到基于<b class='flag-5'>Arm</b>的MSPM<b class='flag-5'>0</b>的迁移指南

    迁移到基于Arm STM32的MSPMO指南

    电子发烧友网站提供《迁移到基于Arm STM32的MSPMO指南.pdf》资料免费下载
    发表于 09-07 11:17 0次下载
    <b class='flag-5'>从</b>迁移到基于<b class='flag-5'>Arm</b> STM32的MSPMO指南

    将软件8位(字节)可寻址CPU迁移至C28x CPU

    电子发烧友网站提供《将软件8位(字节)可寻址CPU迁移至C28x CPU.pdf》资料免费下载
    发表于 09-06 10:42 0次下载
    将软件<b class='flag-5'>从</b>8位(字节)可寻址<b class='flag-5'>CPU</b>迁移至C28x <b class='flag-5'>CPU</b>

    Renesas RL78到基于Arm的MSPM0的迁移指南

    电子发烧友网站提供《Renesas RL78到基于Arm的MSPM0的迁移指南.pdf》资料免费下载
    发表于 08-23 09:28 0次下载
    <b class='flag-5'>从</b>Renesas RL78到基于<b class='flag-5'>Arm</b>的MSPM<b class='flag-5'>0</b>的迁移指南

    AI手机到AI PC,Arm拿什么打造AI盛宴?

    电子发烧友网报道(文/黄晶晶)去年,Arm基于Armv9.2架构推出了Cortex-X4内核,更早前还有Cortex-X3/2/1内核。今年,Arm推出了第二代Armv9.2 CPU 集群,其中包括
    的头像 发表于 06-27 17:31 2030次阅读
    <b class='flag-5'>从</b>AI手机到AI PC,<b class='flag-5'>Arm</b>拿什么打造AI盛宴?

    SoC芯片设计系列-ARM CPU子系统组件介绍

    ARM架构的CPU子系统中,组件设计旨在高效地整合了多种功能模块,以支持处理器核心的运行、内存管理、中断处理、数据交换以及与外部设备的交互等。
    的头像 发表于 05-31 10:56 3018次阅读
    SoC芯片设计系列-<b class='flag-5'>ARM</b> <b class='flag-5'>CPU</b>子系统组件介绍

    stm8复位后,PC的值为0x0000,而flash是0x8000开始的,请问pc的值是怎么变化的呢?

    stm8复位后,PC的值为0x0000,而flash是0x8000开始的,请问pc的值是怎么变化的呢,谢谢
    发表于 05-15 08:32

    如何定义多个变量指定的位置开始存放?

    (.ARM.__AT_0x20004004) 上面这种方法需要在每个变量后面都指定一个地址,有没有什么办法可以让某一段或一个C文件的变量从一个指定的位置开始存放呢?
    发表于 04-17 06:50

    谷歌发布Arm架构CPU,性能超越x86和通用Arm芯片

    据悉,谷歌计划借助谷歌云提供名为Axion的基于Arm的中央处理器(CPU)。该公司表示,其性能优越,超过同类x86芯片及云端通用Arm芯片。
    的头像 发表于 04-10 09:25 593次阅读

    CPU中断程序:硬件看什么是中断?

    CPU响应中断转去执行中断服务程序前,需要把被中断程序的现场信息保存起来,以便执行完中断服务程序后,接着被中断程序的断点处继续往下执行。
    发表于 03-26 11:36 4011次阅读
    <b class='flag-5'>CPU</b>中断程序:<b class='flag-5'>从</b>硬件看什么是中断?

    0开始创建AWTK应用程序】编译应用到RTOS平台

    AWTK是基于C语言开发的跨平台GUI框架。本系列文章介绍如何0开始创建AWTK应用程序,包括搭建开发调试环境、使用AWTK创建Hello工程并在模拟器上运行、将AWTK应用程序移植到其它平台。在
    的头像 发表于 03-21 08:23 639次阅读
    【<b class='flag-5'>从</b><b class='flag-5'>0</b><b class='flag-5'>开始</b>创建AWTK应用程序】编译应用到RTOS平台