0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Zynq上的非对称多核处理器

OpenFPGA 来源:OpenFPGA 作者:OpenFPGA 2022-06-16 10:18 次阅读

ZYNQ从放弃到入门(十二)- AMP — Zynq 上的非对称多核处理器

之前介绍的所有文章我们都只使用了一个 ARM Cortex-A9 处理器内核(Core 0)。然而,PS 端包含两个处理器内核,对于许多应用程序,我们希望同时使用两个 Zynq 内核以获得最佳性能。将两个 Zynq 处理器内核用于不同的任务可以称为非对称多核处理 (AMP,Asymmetric Multiprocessing),并且可以涉及以下任意组合:

Core 0 和 Core 1 上运行不同操作系统

Core 0 上运行操作系统,Core 1 上运行裸机代码(反之亦然)

两个Core上的裸机代码执行不同的程序

AMP介绍

有两种多核处理方式:对称和非对称。在我们定义两者之间的区别之前,我们首先必须定义什么是多核处理:“多核处理是在系统中使用多个处理器。这可以允许同时执行多条指令。但是,它不一定非要如此。” 对称和非对称多核处理之间的区别是

对称多核处理通过将处理进程分布在多个微处理器内核上来同时运行多个软件任务

非对称多处理使用专门的处理器来运行特定的应用程序或在相同的处理器上运行专门的应用程序

在接下来的几篇博客中,我们将介绍 Zynq SoC 上的 AMP。首先,我们研究两个裸机应用程序,每个应用程序都运行在不同的core上。在 Zynq SoC 上运行 AMP 时,必须考虑 Zynq 处理器core混合了私有资源和共享资源。两个处理器都有私有的 L1 指令和数据缓存、定时器看门狗以及共享的中断控制器(共享和私有中断)。然而,Zynq 上的中断并不那么简单,因为 PS 中的每个内核都能够使用软件中断来中断自己、另一个处理器或两个处理器,这些中断是通过中断控制器来分发的。

Zynq SoC 还拥有大量共享资源,常见示例包括 I/O 外设、片上存储器、中断控制器分配器、L2 高速缓存和位于 DDR 存储器内的系统存储器。下图显示了其中一些资源。

cf39db9c-ed0c-11ec-ba43-dac502259ad0.png

我们将从 DDR 内存运行两个处理器内核,因此我们必须非常小心地对每个处理器使用的地址区域进行分段。地址是通过每个应用程序的链接描述文件确定的。如果我们对此处理不当,在不同内核上运行的应用程序可能会干扰彼此的操作。

我们还必须修改 SDK 自动生成的文件以使系统启动并运行。第一步将根据XAPP1079(http://www.xilinx.com/support/documentation/application_notes/xapp1079-amp-bare-metal-cortex-a9.pdf)修改第一阶段引导加载程序,它将检查裸机/裸机 AMP。

我最初打算创建一个非常简单的系统,一旦它启动并运行,我们就可以对其进行扩展。第一个应用程序将让 Zynq SoC 的处理器 Core 0 通过 RS232 与用户通信,而 Core 1 在驱动连接到 ZYNQ IO 的 LEDS 。这两个应用程序无需交互即可同时运行。

启动和运行AMP

虽然启动和运行 AMP 需要几个步骤,但它实际上是非常简单直接的过程,当然没什么好害怕的。

让 AMP 在 Zynq SoC 上运行的关键方面是引导加载程序,它在将第一个可执行文件加载到内存后查找第二个可执行文件。为了简单化,我将使用赛灵思应用笔记 XAPP1079 中提供的修改后的 FSBL 和修改后的独立操作系统。(源文件可在此处获得http://www.xilinx.com/support/documentation/application_notes/xapp1079-amp-bare-metal-cortex-a9.pdf)

下载 zip 文件后,第一步是将压缩文件解压缩到所需的工作目录中,并将名为 SRC 的文件夹重命名为 design。这些文件包含修改后的 FSBL 和修改后的独立操作系统。我们需要 SDK 了解这些文件,因此下一步是更新 SDK 存储库(repository)以使 SDK 了解它们的存在。在 SDK的Xilinx 工具菜单下中,选择存储库,然后选择新建,导航到目录位置 <工作目录>app1079designworksdk_repo,如下所示:

cf550796-ed0c-11ec-ba43-dac502259ad0.png

在存储库中添加后,下一阶段是生成以下内容:

AMP 第一阶段引导加载程序

core 0 应用程序

core 1 应用程序

我们将为其中的每一个core生成一个 BSP(板级支持包)。

首先要做的是创建一个新的 FSBL。选择file -> new application -> project,这使我们能够创建一个支持 AMP 的 FSBL 项目。这与我们之前所做的相同,但是我们将选择 Zynq FSBL for AMP 模板来代替 Zynq FSBL 模板。

cf7a38f4-ed0c-11ec-ba43-dac502259ad0.png

在创建 AMP FSBL 之后,我们需要为第一个内核创建应用程序。这又很简单,我们以前做过很多次了。确保选择 Core 0 和独立操作系统并允许它创建自己的 BSP。

cf9e2bf6-ed0c-11ec-ba43-dac502259ad0.png

一旦我们创建了这个应用程序,我们需要在 DDR 内存中正确定义应用程序将执行的位置。为此,我们如下编辑链接描述文件以显示 DDR 基地址和大小。这个很重要,如果我们没有对 Core 0 和 Core 1 应用程序的 DDR 内存进行正确分段,我们就有可能无意中损坏另一个应用程序。

cfbaba14-ed0c-11ec-ba43-dac502259ad0.png

我们现在可以编写我们希望在core 0 上执行的应用程序。我们需要将以下代码部分包含在应用中。

cfd6b138-ed0c-11ec-ba43-dac502259ad0.png

此代码禁用 Zynq SoC 片上存储器上的缓存,并将 Core 1 程序的起始地址写入 Core 1 将在 Core 0 执行 Set Event (SEV) 命令后访问的地址。SEV 命令使 Core 1 开始执行其程序。

下一步是为 Core1 创建 BSP。我们想使用修改后的独立操作系统 (standalone_amp),它可以防止重新初始化 PS Snoop 控制单元 (SCU)。因此,我们不能像为 Core 0 那样创建项目时允许自动生成 BSP。请务必在 CPU 选择选项中选择 Core 1。

cfed6af4-ed0c-11ec-ba43-dac502259ad0.png

现在我们已经为 Core 1 创建了 BSP,我们需要修改 BSP 的设置,然后才能继续创建要在 Core 1 上运行的应用程序。这非常简单,需要添加一个额外的编译器标志-DUSE_AMP=1 到 BSP 的驱动程序部分的配置:

d017c150-ed0c-11ec-ba43-dac502259ad0.png

完成后,我们可以自由地为 Core 1 创建应用程序。确保选择 Core 1 作为处理器并使用我们刚刚创建的 BSP:

d02c0c14-ed0c-11ec-ba43-dac502259ad0.png

同样,在创建新应用程序后,我们需要再次在 DDR 内存中正确定义内存位置,Core 1 程序将从该位置执行。这是通过编辑 Core 1 应用程序的链接器脚本来实现的:

d04a1114-ed0c-11ec-ba43-dac502259ad0.png

与此应用程序中的第一个内核一样,我们还必须禁用片上内存上的缓存,因为我们将在以后的博客中使用此内存在两个处理器之间进行通信. 一旦我们完成了我们的应用程序并构建了项目,我们现在应该拥有以下内容:

AMP FSBL ELF

core 0 ELF

core 1 ELF

定义设备配置的位文件。

我们现在需要一个 .bin 文件来使 Zynq SoC 从选择的配置存储器启动。我们还需要一个 bif 文件,它定义了用于创建 bin 的文件,并且我们需要定义文件的顺序。

我们将使用 XAPP 1079 的 directorydesignworkootgen 下提供的 bat 文件,而不是使用在 SDK 中创建的 Zynq 启动映像。该目录包含一个 bif 文件和一个 cpu1_bootvec.bin,该文件用作修改后的 FSBL 的一部分,以阻止它寻找更多要加载的应用程序。

为了生成bin文件,我们将生成的三个ELF文件复制到bootgen目录并编辑BIF文件,确保bif文件中的elf名称正确。

d060783c-ed0c-11ec-ba43-dac502259ad0.png

我们现在可以打开 ISE/Vivado 命令提示符,导航到 bootgen 目录,然后运行 createboot.bat,将创建 boot.bin 文件:

d0737c98-ed0c-11ec-ba43-dac502259ad0.png

然后可以将该文件下载到 Zynq SoC 上的flash中。引导设备运行两个内核启动并执行各自的程序。

下一节我们在聊聊一些细节。

上一节文章创建了两个core上启动并运行简单的软件。它的简单性使我能够展示如何让两个 Zynq SoC 处理器内核通过 OCM(片上存储器)进行通信。但是,两个核上运行的软件目前正在做一些简单的事情,因此我们有一个可以继续前进的基线。

Core 0 是主控并控制执行 Core 1。它还使用 UART 向终端程序打印消息。

一旦由 Core 0 启动,Core 1 就会初始化其私有资源并驱动八个 LED 。我们需要使用 Core 1 的私有定时器并通过 GIC 启用中断。

这些应用程序没有任何关联,也不共享资源。但是,实际的应用程序希望能够做到这一点。在 Core 0 上运行的应用程序非常简单。它在 Core 1 上启动软件,然后使用 UART 0 在循环中打印出一条简单的消息:

d0bff8fc-ed0c-11ec-ba43-dac502259ad0.png

但是,我们计划使用 Core 1 的中断控制器,因此我们必须首先使用以下代码配置 GIC(通用中断控制器):

d0d9bda0-ed0c-11ec-ba43-dac502259ad0.png

Core 1 代码必须稍微复杂一些,因为我们使用 Zynq SoC 的 PL(可编程逻辑)端的 GPIO 模块来驱动 ZYNQ 上的 LED。与赛灵思的所有其他接口一样,独立操作系统为此通过#include提供了一组简单的驱动程序,“xgpio.h” 这个文件与我们之前用来驱动连接到 Zynq SoC 的 PS(处理系统)端的 MIO / EMIO GPIO 的 xgpio_ps.h 文件略有不同。然而,在本例中,我想展示如何在 Zynq SoC 的 PL 端使用 GPIO。为了确保我们可以看到 LED 的开关,我们将使用 Core 1 的私有计时器,这与我们过去在核心 0 上使用私有计时器相同。

d0f47ac8-ed0c-11ec-ba43-dac502259ad0.png

在 Core 1 的程序开始执行其主应用程序之前,我们需要禁用片上存储器 (OCM) 上的缓存,初始化 GPIO,初始化私有定时器,并配置中断控制器,以便可以使用私有定时器的中断来切换LED。我们现在可以开始编写相当简单的中断服务例程,在专用定时器结束并重新启动时切换 LED。这个过程将永远持续下去。

d13cb158-ed0c-11ec-ba43-dac502259ad0.png

以下是程序执行的结果,正如 Core 0 向终端窗口输出的报告:

d16a8f4c-ed0c-11ec-ba43-dac502259ad0.png

代码地址

https://github.com/suisuisi/zynq_guide/blob/main/core_0_main_part50.c

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19265

    浏览量

    229670
  • 操作系统
    +关注

    关注

    37

    文章

    6808

    浏览量

    123290
  • Amp
    Amp
    +关注

    关注

    0

    文章

    81

    浏览量

    47156

原文标题:ZYNQ从放弃到入门(十二)- AMP — Zynq 上的非对称多核处理器

文章出处:【微信号:Open_FPGA,微信公众号:OpenFPGA】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    “双系统”出炉!瑞芯微RK3562J非对称AMP:Linux+RTOS/裸机

    。“非对称AMP”双系统是指多个核心相对独立运行不同的操作系统或裸机应用程序,如Linux + RTOS/裸机,但需一个主核心来控制整个系统以及其它从核心。每个处理器核心相互隔离,拥有属于自己的内存
    发表于 11-21 16:44

    旋智多核处理器助力电机控制应用

    电机控制应用软件通常需要实时处理,以确保精确控制和快速响应。高性能、多核嵌入式处理器能够实时处理多项复杂计算,是保持电机控制系统稳定性和准确性的关键。
    的头像 发表于 10-24 16:17 477次阅读
    旋智<b class='flag-5'>多核</b>心<b class='flag-5'>处理器</b>助力电机控制应用

    对称多处理器的特点是什么

    的主要特点是处理器之间的对称性,这意味着每个处理器都可以执行任何任务,并且它们在处理能力是等价的。 1. SMP的定义和历史
    的头像 发表于 10-10 16:36 378次阅读

    对称多处理器系统中的进程分配包括

    在现代计算机系统中,对称多处理器(SMP)架构已经成为主流。这种架构允许多个处理器共享相同的内存地址空间和系统资源,从而提高了系统的处理能力和吞吐量。然而,为了充分利用SMP系统的性能,操作系统
    的头像 发表于 10-10 16:34 250次阅读

    对称多处理器非对称多处理器的区别

    (Symmetric Multi-Processing,简称SMP)和非对称多处理器(Asymmetric Multi-Processing,简称AMP)。这两种架构在设计理念、资源管理、任务分配和性能优化等方面存在显著差异。 对称多处理器(SMP) 定义
    的头像 发表于 10-10 15:58 872次阅读

    为Xilinx® Zynq®UltraScale™系列多处理器中的VCCINT_VCU轨供电

    电子发烧友网站提供《为Xilinx® Zynq®UltraScale™系列多处理器中的VCCINT_VCU轨供电.pdf》资料免费下载
    发表于 09-25 10:54 0次下载
    为Xilinx® <b class='flag-5'>Zynq</b>®UltraScale™系列多<b class='flag-5'>处理器</b>中的VCCINT_VCU轨供电

    请问高频放大器用非对称电源供电会有什么影响?

    高频放大器用非对称电源供电会有什么影响?
    发表于 08-29 06:22

    TMS320C6474多核数字信号处理器数据表

    电子发烧友网站提供《TMS320C6474多核数字信号处理器数据表.pdf》资料免费下载
    发表于 08-01 11:09 0次下载
    TMS320C6474<b class='flag-5'>多核</b>数字信号<b class='flag-5'>处理器</b>数据表

    OPA828运放非对称电源供电有什么好处吗?

    看到一些精密仪器的电路运放好像特意设计成非对称电源供电,比如+14v、-17v这种,请问运放非对称电源供电有什么好处吗?信号摆幅不超过正负7v
    发表于 08-01 06:48

    【本周六-上海】SMP对称多处理 线下培训

    对称多处理(SymmetricMultiprocessing,SMP)是一种常见的并行计算架构,其中多个处理器核心共享相同的内存和总线系统。这种架构允许多个处理器核心同时运行独立的指令流,从而
    的头像 发表于 06-13 08:35 307次阅读
    【本周六-上海】SMP<b class='flag-5'>对称多处理</b> 线下培训

    线下培训 | 瑞萨电子基于RZ/G2L的OpenAMP混合部署实战培训

    OpenAMP一个提供用于处理非对称多处理(AMP)系统的软件组件,可以简化异构多核处理器系统间的高效通信,提供跨平台、可扩展且灵活的解决方案。通过OpenAMP,开发人员可以轻松地在
    的头像 发表于 05-17 08:01 576次阅读
    线下培训 | 瑞萨电子基于RZ/G2L的OpenAMP混合部署实战培训

    单相降压转换非对称BG评估板数据手册

    电子发烧友网站提供《单相降压转换非对称BG评估板数据手册.rar》资料免费下载
    发表于 04-14 17:10 0次下载
    单相降压转换<b class='flag-5'>器</b>双<b class='flag-5'>非对称</b>BG评估板数据手册

    单相降压转换非对称AG评估板数据手册

    电子发烧友网站提供《单相降压转换非对称AG评估板数据手册.rar》资料免费下载
    发表于 04-14 17:02 0次下载
    单相降压转换<b class='flag-5'>器</b>双<b class='flag-5'>非对称</b>AG评估板数据手册

    用于多核处理器的可配置多轨PMU TPS650860数据表

    电子发烧友网站提供《用于多核处理器的可配置多轨PMU TPS650860数据表.pdf》资料免费下载
    发表于 03-07 14:00 0次下载
    用于<b class='flag-5'>多核</b><b class='flag-5'>处理器</b>的可配置多轨PMU TPS650860数据表

    为什么三相短路是对称故障?单相短路是非对称故障呢?

    为什么三相短路是对称故障?单相短路是非对称故障呢? 三相短路是对称故障,而单相短路是非对称故障,其根本原因在于电网中的相量关系和电压分布。 首先,
    的头像 发表于 02-18 11:41 4002次阅读