利用赛灵思Zynq SoC 上的两个ARM A9 内核可以显著提高您的系统性能。
赛灵思Zynq®-7000 全可编程SoC 的众多优势之一就是拥有两个ARM® Cortex ™ -A9板载处理器。不过,很多裸机应用和更为简单的操作系统只使用Zynq SoC 处理系统(PS)中两个ARM 内核中的一个,这种设计方案可能会限制系统性能。
根据所开发的应用类型不同,可能需要这两个处理器都运行裸机应用,或者需要在每个处理器上运行不同的操作系统。例如,其中一个处理器执行关键计算任务,从而运行裸机/RTOS 应用,同时第二个处理器通过Linux 提供HMI 和通信功能。
什么是多处理?
这两种方案都属于多处理。简单定义:多处理就是在一个系统中使用一个以上的处理器。多处理架构可允许一次执行多个指令,但并非必须如此。
多核处理包括两种类型:对称和非对称。
对称多处理是通过将负载分配给多个内核,从而能够同时运行多个软件任务。而非对称多处理(AMP)则是使用专用处理器,或者针对特定应用或任务在相同处理器上执行应用。
根据定义,使用Zynq SoC 上的两个内核执行裸机应用或不同操作系统都属于非对称多处理。Zynq SoC 上的AMP 可能涉及如下几种组合:
• 在内核0 和内核1 上运行不同操作系统;
• 在内核0 上运行操作系统,在内核1 上运行裸机应用( 反之亦然);
• 在两个内核上均运行裸机应用,执行不同程序。
当您决定在Zynq SoC 上创建AMP系统时必须考虑一个实际问题, 即ARM 处理器内核同时包含必须进行正确寻址的私有资源和共享资源。这两个处理器都有私有的L1 指令和数据高速缓存、定时器、监视时钟以及中断控制器(针对共享和私有中断)。另外还存在一些共享资源,常见的有I/O 外设、片上存储器、中断控制器分配器、L2高速缓存和位于DDR 存储器中的系统内存(见图1)。这些私有和共享资源均需要精心管理。
图1 – Zynq SoC处理系统,显示私有和共享资源
每个PS 核都有自己的中断控制器,能够利用软件中断实现自身与一个或两个内核的中断。这些中断通过ARM 的分布式中断控制器技术完成分配。
由于针对每个内核执行的程序都位于DDR 存储器内,因此您必须特别注意以确保对这些应用进行正确分割。
建立AMP
建立AMP 并使其运行在Zynq SoC 上所需的关键因素是引导载入程序,该程序会在第一个应用载入到存储器后寻找第二个可执行文件。赛灵思在XAPP1079 中提供了有用的应用指南和源代码。该文档包含修改后的第一阶段引导载入程序(FSBL)和独立OS,可用来创建AMP 系统。
首先要做的是下载与应用说明配套提供的ZIP 文件,再将FSBL 和OS 这两个要素解压到期望的工作目录。然后,必须给名为SRC“design”的文件夹重新命名。现在,非常重要的一点是一定要确保软件开发套件(SDK)知道这些新文件(修改后的FSBL 和独立OS,两者兼备)的存在。因此,下一步需要更新您的SDK 库,以便使其知道这些新文件的存在。
这很容易实现。在SDK 中赛灵思工具菜单下选择“库”,然后选择“新建”,随之导航到目录位置< 您的工作目录>app1079designworksdk_repo,如图2 所示。
图2 — 将您的新文件添加到库
使用软件中断与硬件中断基本相似,区别只在于您如何触发它们。
处理器间的通信
为AMP 设计创建应用之前,您需要考虑应用如何进行通信(如有需要)。最简单的方法是使用片上存储器。Zynq SoC 配备256KB 的片上SRAM,可从以下四个源地址进行访问:
• 利用侦测控制单元(SCU)从任意内核进行访问;
• 利用SCU 通过AXI 加速器一致性端口(ACP)从可编程逻辑进行访问;
• 利用片上存储器(OCM)互联通过高性能AXI 端口从可编程逻辑进行访问;
• 也是利用OCM 从中央互联进行访问。
由于这些不同的访问源都能对片上存储器进行读写,因此尤为重要的一点是,在使用OCM 之前一定要首先详细了解其的运行方式。
既然OCM 有多个访问源,那么显然应该定义一个仲裁和优先级形式。由于侦测控制单元需要最低时延(SCU 既可以是处理器内核也可以是AXI ACP 接口),因此SCU 从这些访问源的读操作就具有最高优先级,紧接着是SCU 写操作,然后是OCM 互联读/ 写操作。用户可通过将片上存储器控制寄存器中的SCU 写操作的优先级设置为低来颠倒SCU 写操作和OCM 互联访问的优先级。
OCM 本身结构为128 位字,分成四个64KB 分区,并位于PS 地址空间的不同位置。初始配置下,前三个64KB 区块布置在地址空间的起始位置,最后一个64KB 区块置于地址空间的末尾(见图5)。
简单的片上存储器实例
您可使用赛灵思I/O 函数访问OCM,以便从所选的存储器地址读取和写入数据。这些函数包含在Xil_IO.h 中,可支持在CPU 地址空间内存储和访问8 位、16 位或32 位字符型、短整型或整型数据。使用这些函数时,只需知道您希望访问的地址以及想要在此存储的值即可。如果是写操作,方法如下,
使用该技术时要确保两个地址指向片上存储器中的相同位置,尤其是当不同人编写不同内核程序时更应如此,为此更好的方法是使用共同的头文件。该文件将包含针对特定传输的相关操作地址的宏定义,例如:
另一种备选方法是让两个程序都使用指示器来访问存储单元。您可以通过使用宏命令定义指向恒定地址的指示器(一般用C 语言)来实现这一点:
此外,您还可以对地址再次进行宏定义,以确保该地址为两个应用程序的共用地址。这种方法无需使用赛灵思I/O 库,而是通过指示器实现简单访问。
处理器间的中断
Zynq SoC 中的每个内核都有16 个软件生成的中断。如上文所提到的,每个内核都能实现自身与另一个内核或两个内核的中断。使用软件中断与使用硬件中断基本相似,区别只在于您如何触发它们。若使用软件中断,正在接收的应用就无需针对更新数据而对目标存储单元进行轮询。
就像使用任何硬件中断时一样,您需要对两个内核中的通用中断控制器进行配置。敬请参阅《赛灵思中国通讯》第52 期的“如何在Zynq SoC上使用中断”以了解更多相关信息。
然后,您可以使用xscugic.h 中提供的XScuGic_SoftwareIntr 函数在正在更新的内核中触发软件中断。该命令将向该指定内核发出一个软件中断,再由该内核进行适当操作:
您必须为内核0和内核1应用对DDR存储器进行正确分段,否则会存在其中一个应用破坏另一个应用的风险。
创建应用
将文件添加到库之后,下个阶段就是生成AMP 解决方案的三个重要部分:AMP 第一阶段引导载入程序、内核0应用和内核1 应用。您必须为每个部分生成一个不同的板支持包(BSP)。
您需要做的第一件事是用SDK创建一个新的FSBL。选择“新建应用项目”,创建一个支持AMP 的FSBL 项目。这与创建一般FSBL 的过程没有什么不同。不过,这次您需要选择“Zynq FSBL for AMP”模板,如图3 所示。
图3 – 为AMP设计选择第一阶段引导载入程序
完成AMP FSBL 创建之后,接下来需要为第一个内核创建应用。一定要选择内核0 和您的首选操作系统,并允许其创建自己的BSP,如图4 所示。
图4 – 为内核0创建应用和BSP
创建应用之后,您需要正确定义应用在DDR 存储器中的位置(应用将从该位置执行)。为此,您需要编辑图5 中的链接器脚本,以显示DDR 的基地址和大小。这一点很重要,因为如果没有为内核0 和内核1应用对DDR 存储器进行正确分段,就会存在其中一个应用破坏另一个应用的风险。
图5 – 内核0的DDR位置和大小
完成分段之后,您现在可以编写希望在内核0 上执行的应用,因为该内核是AMP 系统中的主管。内核0 必须启动内核1 应用的执行。您需要将图6 中的代码段包含在应用中。这段代码禁用片上存储器上的高速缓存,并将内核1 程序的起始地址写到一个内核1 将会访问的地址。一旦内核0 执行Set Event(SEV)命令,内核1 便开始执行其程序。
图6 – 通过编码禁用片上存储器上的高速缓存
下一步是为内核1 创建BSP。一定要使用修改后的独立OS(standalone_amp,如图7 所示),这一点很重要,因为它能防止PS 侦测控制单元的重新初始化。就这一点而言,在创建项目时不要像对待内核0那样允许其自动生成BSP。必须确保在CPU 选项中选择内核1。
图7 – 为内核1创建BSP
既然您已经为内核1 创建了BSP,那么接下来首先需要修改BSP的设置,才能继续创建您想要在内核1 上运行的应用。这非常简单,只需要向BSP 驱动器部分的配置中添加一个额外的编译器标志:–DUSE_AMP=1。
这一步完成后,您就可以任意为内核1 创建应用了。务必选择内核1 作为处理器,并使用您刚刚创建的BSP。创建新应用之后,您需要再次在DDR 存储器中定义正确的存储单元,而内核1 程序将从此处执行。您可按照之前的方法通过编辑内核1 应用的链接器脚本来完成设定。与第一个内核一样,在该应用中同样要禁用片上存储器上的高速缓存—— 该高速缓存可用来在这两个处理器之间进行通信。
将所有组件完美整合
在创建应用和构建项目之后,您现在应已拥有以下组件:
• AMP FSBL ELF ;
• 内核0 ELF ;
• 内核1 ELF ;
• BIT 文件,用来为预期能够实现AMP 的Zynq 器件定义配置。
使用所提供的工具在Zynq SoC上创建非对称多处理应用可以变得非常简单。
为了使Zynq SoC 从所选的配置存储器中引导,您需要一个.bin 文件。要创建该文件,您还需要一个BIF 文件。BIF 文件规定了应使用哪些文件创建BIN 文件以及它们的顺序。不要使用SDK 中的“创建Zynq”引导映像,而应使用ISE® 设计套件命令提示符和BAT 文件(BAT 文件是XAPP1079 的一部分,位于下载目录designworkootgen)。该目录包含一个BIF 文件和一个cpu1_bootvec.bin,后者作为修改后的FSBL 的一部分,用于阻止其查找和加载更多应用。
要生成BIN 文件,您需要将生成的三个ELF 文件复制到bootgen 目录,并对BIF 文件进行编辑以确保其中的ELF 名称正确无误(如图8 所示)。
图8 – 修改BIF文件
现在您可打开一个ISE 命令提示符,并导航至bootgen 目录。在这里运行createboot.bat。该步骤将创建boot.bin 文件(如图9 所示)。
图9 – 创建将在Zynq SoC上运行的boot.bin文件
然后,您可将该文件下载到ZynqSoC 上的非易失性存储器中。该器件的引导将使两个内核启动并执行其各自的程序。
使用所提供的工具在Zynq SoC上创建非对称多处理应用可以变得非常简单。使用片上存储器或DDR 分区可以很容易地实现两个内核之间的通信。
评论
查看更多