基于多核DSP的BootLoader程序的实现-电子发烧友网

DSP 芯片的BootLoader程序用于实现用户程序上电自举，它有多种工作方式。上电自举就是将用户存放在片外的非易失性、慢速的存储器中的程序装载到片内易失的、高速的存储空间中，以保证用户程序在DSP核内的高速运行。

多核DSP是指由多个独立的DSP子核集成的DSP芯片，且所有DSP子核共享一套片外总线。由于每个DSP子核内部都有其自身独立的掩模BootLoader程序，当DSP芯片上电或复位时所有DSP子核都将自行启动自身独立的BootLoader程序，实现用户程序的上电自举。

所以，多核DSP的BootLoader程序的实现方法与单核DSP的BootLoader程序的实现方法有较大的差异。为此，本文立足于实践，以双核DSP- TMS320VC5421的１６位并行ＥＰＲＯＭ的BootLoader程序的工作方式为例，详细阐述了多核DSP的BootLoader程序的实现方法。

１ BootLoader程序简介

１．１ BootLoader程序的四种工作方式

一般的DSP都采用常见的BootLoader程序工作方式来实现用户程序的上电自举：

处理器通信口（主端口）HPI方式--通过DSP芯片与ＰＣ机或DSP芯片与其它DSP芯片之间的主机通信端口实现上电自举；

８位或１６位并行EPROM方式--通过DSP内核的ＤＭＡ通道实现上电自举；

８位或１６位并行I/O方式--通过DSP芯片的片外并行I/O接口实现上电自举；

８位或１６位串行口方式--通过DSP芯片的串行端口实现上电自举。

在以上四种工作方式中，最常用的是１６位并行EPROM方式。即在DSP芯片上电或复位时，通过ＤＭＡ通道将存储在核外EPROM中的程序以１６位形式存储到核内的程序空间中。

１．２１６位并行EPROM方式的Boot表

各种方式的BootLoader程序都有其固定格式的Boot表，用来实现用户程序的上电自举。１６位并行EPROM方式的Boot表如表１所示。表中的第１表项存放BootLoader程序工作方式控制字，用于DSP芯片上电或复位时确认该Boot表是否为１６位并行ＥＰＲＯＭ工作方式的Boot表。该表项内容为10AAH，表示DSP内核认为该Boot表是１６位并行ＥＰＲＯＭ工作方式的BootLoader程序的Boot表；

否则DSP内核认为该Boot表不是１６位并行ＥＰＲＯＭ的方式的Boot表；第２表项存放DSP特殊寄存器SWWSR在上电或复位时被赋予的初始化数值；第３表项存放DSP特殊寄存器ＢＳＣＲ在上电或复位时被赋予的初始化数值；第４表项存放用户程序将要被存放在DSP核内程序空间的页地址；第５表项存放用户程序将要被存放到DSP核内程序空间的页内偏移地址；

从第６表项开始依次存放用户程序第ｍ段代码的长度Ｎ。用户程序第ｍ段代码将要被存放到DSP核内程序空间的页地址，用户程序第ｍ段代码将要被存放到DSP核内程序空间的页内偏移地址，用户程序第ｍ段代码的第１个字，第２个字，……，第Ｎ个字；

Boot表的最后表项存放Boot表结束字００００Ｈ，表示Boot表到此结束。因此DSP内核要实现BootLoader程序，在上电复位后首先要申请到片外数据、地址总线的控制权，然后再根据Boot表完成用户程序上电自举过程。

１．３１６位并行EPROM工作方式Boot表的生成

所有BootLoader程序所需的Boot表的数据结构都是通过执行包含－ｖ５４８参数的链接命令和Ｈｅｘ５００转换命令的程序形成的。在链接过程中确定用户程序和数据的存放地址，在Ｈｅｘ５００转换过程中定义BootLoader程序的工作方式和用户程序执行的入口地址等。

为了生成１６位并行ＥＰＲＯＭ方式的Boot表首先，在链接程序时必须设置－ｖ５４８选项；然后使用ＴＩ公司DSP开发工具自带的ＨＥＸ５００．ＥＸＥ文件，根据用户的ＣＯＦＦ格式的代码生成Boot表中的相应内容。

HEX500.EXE可执行文件一般使用以下几种参数

（１）*.out ：用户的COFF格式的程序；

（２）-e ：确定用户程序的入口点；

（３）-a ：以ASCII形式，根据用户的。ｏｕｔ文件输出对应的ＨＥＸ文件；

（４）－Boot实现用户程序的装载；

（５）－bootorg ：确定生成哪种形式的Boot表；

（６）－ｍｅｍｗｉｄｔｈ：确定引导方式的位数；

（７）－Ｏ *．ｈｅｘ：输出的ＨＥＸ文件的名称。

例如：

hex500 ti.out ／根据ti.out文件生成Boot表／

-e 0x4000 ／用户程序的入口点为0x4000／-a ／以ASCII形式输出ＨＥＸ文件／－Boot ／装载用户的程序ｔｉ．ｏｕｔ／

－BootｏｒｇＰＡＲＡＬＬＥＬ／生成并行ＥＰＲＯＭ方式的Boot表／－ｍｅｍｗｉｄｔｈ１６／生成１６位的Boot表／

－ｏｔｉ．ｈｅｘ／生成的ＨＥＸ文件名为ｔｉ．ｈｅｘ／

执行完该HEX500.EXE命令后，系统会创建一个文件名为ｔｉ．ｈｅｘ的ＡＳＣＩＩ文件，然后用户根据ｔｉ．ｈｅｘ文件内容对ＥＰＲＯＭ进行编程就能产生上述的１６位并行ＥＰＲＯＭ工作方式的Boot表。

２多核DSP的BootLoader程序的实现

目前ＴＩ公司已经不再局限于生产单核DSP。为了提高用户程序运行的效率，ＴＩ公司又推出了２核、４核等多核DSP。在实现多核DSP上电自举时，每一个子核都需要申请片外总线的控制权。对于单核DSP而言，只有一个DSP内核，对应一个BootLoader程序，DSP核可以永远拥有片外总线的控制权。

但对于多核DSP而言，由于只有一套片外总线，所以片外总线的控制权不允许也不可能永远被其中的某一个DSP子核所拥有。因此，多核DSP需要片外总线仲裁机制，以避免片外总线冲突。

下面以双核DSP-ＴＭＳ３２０ＶＣ５４２１的１６位并行ＥＰＲＯＭ方式的BootLoader程序实现过程为例，详细阐述多核DSP的BootLoader程序的实现。

２．１ TMS320VC5421结构简介

TMS320VC5421 １６位定点双核DSP，它集中了早期ＴＭＳ３２０Ｃ５４Ｘ系列DSP的优点，并提供了许多新的功能。其内部结构与ＴＭＳ３２０Ｃ５４Ｘ系列的其它款式DSP有很大的不同，其简单结构框图如图１所示。

由于每个DSP子核的工作频率是１００ＭＨｚ，所以它的工作速率可达到２００ＭＩＰＳ，且它的每一个DSP子核都具备单核DSP（如ＴＭＳ３２０ＶＣ５４０２）的所有特性。２．２ TMS320VC5421的１６位并行ＥＰＲＯＭ工作方式的BootLoader程序的选择

TMS320VC5421的两个DSP子核在DSP芯片上电或复位时，能否启动各自的BootLoader程序以完成上电自举功能，是由每个子核自身的XIO和ＧＰＩＯ０／ＲＯＭＥＮ两个管脚决定的。在DSP芯片上电或复位时，每个DSP子核自动检测自身的ＸＩＯ和ＧＰＩＯ０／ＲＯＭＥＮ两个管脚，如果对应的ＸＩＯ和ＧＰＩＯ０／ＲＯＭＥＮ两个管脚都为高电平则启动自身的BootLoader程序完成用户程序的上电自举。

每个DSP子核启动BootLoader程序后，采用哪一种BootLoader程序的工作方式是由各自的ＧＰＩＯ１管脚的状态和各自以ＤＭＡ方式从核外数据空间００００Ｈ地址单元读入的数据决定的：检测ＧＰＩＯ１管脚，如果ＧＰＩＯ１管脚为高电平，则采用串行口ＥＥＰＲＯＭ的BootLoader工作方式，否则采用并行ＥＰＲＯＭ的BootLoader工作方式。

若DSP子核的ＤＭＡ通道读入核外数据空间００００Ｈ单元中的数据为１０ＡＡＨ，则采用１６位并行ＥＰＲＯＭ的BootLoader工作方式；若读入的数据为ｘｘ０８Ｈ或ｘｘＡＡＨ则采用８位并行ＥＰＲＯＭ的BootLoader工作方式。否则将重新判断ＧＰＩＯ１管脚的电平，进入死循环。２．３ TMS320VC5421的BootLoader程序片外总线冲突的解决

DSP核的BootLoader程序总是在DSP核上电或复位时启动，且一启动BootLoader程序，对应的DSP核就要申请核外的总线控制权。因此为了避免多核DSP的各个DSP子核启动BootLoader程序时引起的片外总线冲突，可通过控制每个DSP子核的复位过程，使每个DSP子核在不同的时间内启动自身的BootLoader程序来解决片外总线冲突的问题。

为了实现两个DSP子核复位过程的分离，应采用如图２所示的DSP子核复位过程控制方法。

由于ＴＭＳ３２０ＶＣ５４２１中Ａ核拥有倍频的锁相环电路，所以首先复位Ａ核，启动Ａ核的BootLoader程序，实现Ａ核的用户程序上电自举。然后再由Ａ核的用户程序控制Ｂ核的复位过程，启动Ｂ核的BootLoader程序，实现Ｂ核的用户程序上电自举。

在Ａ核的BootLoader程序执行完后，Ａ核就会执行自身的用户程序代码。Ａ核的用户程序代码释放片外总线的控制权，并且控制Ｂ核的复位管脚，促使Ｂ核启动自身的BootLoader程序。如果此时Ａ核中的用户代码又申请片外总线控制权或正在使用片外总线，就会造成片外总线冲突。解决此冲突的办法有如下两个：

粗略估计Ｂ核的BootLoader程序执行时间，在Ａ核的有效程序代码前加一个延迟程序。

在Ａ核的有效程序代码前加入一个死循环程序，当Ｂ核BootLoader程序执行完后，Ｂ核通知Ａ核，Ａ核就跳出这个死循环程序，开始执行自己的有效代码。

２．４ TMS320VC5421的１６位并行EPROM工作方式的BootLoader程序的编程实现

首先设计一个简单的电路图，在DSP的Ａ＿ＸＦ和Ｂ＿ＸＦ两个管脚分别连接一个发光二极管，Ａ核以２Ｈｚ的频率点亮发光二极管，Ｂ核以１０Ｈｚ的频率点亮发光二极管。将１２８Ｋ的ＦＬＡＳＨ？ＳＳＴ３９ＶＦ４００Ａ？分成两页，每页为６４Ｋ。ＦＬＡＳＨ的页的选择由ＴＭＳ３２０ＶＣ５４２１的Ａ＿ＢＤＸＯ管脚控制。当Ａ＿ＢＤＸ０为低电平，即ＦＬＡＳＨ的Ａ１６地址线为低电平时，选中ＦＬＡＳＨ的第一页，由ＦＬＡＳＨ的Ａ０～Ａ１５地址线选择页内地址，用于存放Ａ核的１６位并行ＥＰＲＯＭ工作方式的Boot表。当Ａ＿ＢＤＸ０为高电平，即ＦＬＡＳＨ的Ａ１６地址线为高电平时，选中ＦＬＡＳＨ的第二页，由ＦＬＡＳＨ的Ａ０～Ａ１５地址线选择页内地址，用于存放Ｂ核的１６位并行ＥＰＲＯＭ工作方式的Boot表。

1片外总线冲突的解决

估算Ｂ核执行BootLoader程序所需的时间后，在Ａ核的用户有效程序之前，加一段延迟程序。

延迟的时间计算如下：

TMS320VC5421DSP的ＤＭＡ通道从片外数据空间读取一个字到片内数据空间，需要７个指令周期时间。

统计用户程序大小？将对应Boot表中的所有段的大小相加？Ｎ１＋Ｎ２＋．．．＝Ｎ。

延迟的时间为Ｎ×７＝７Ｎ个指令周期。

由上面所述的方法可知，只需在开始执行Ａ核的有效程序之前加一段延迟７Ｎ个指令周期的代码即可。

（２）生成Boot表

对CPU_A来说，以Ａ核程序流程图建立一个项目Ａｔｉ．ｍｓｋ。产生Ａｔｉ．ｏｕｔ文件后，进入该目录的ＤＯＳ环境，键入：

hex500 Ati．out－ａ－ｅ 0x4000h－Boot－Bootｏｒｇ PARALLEL－ｍｅｍｗｉｄｔｈ１６－ｒｏｍｗｉｄｔｈ１６－ｏＡｔｉ．ｈｅｘ

生成Ａ核的１６位并行ＥＰＲＯＭ工作方式的Boot表。

对ＣＰＵ＿Ｂ来说，同样以Ｂ核程序流程图建立一个项目Ｂｔｉ．ｍｓｋ。产生Ｂｔｉ．ｏｕｔ文件后，进入该目录的ＤＯＳ环境，键入：

hex500 Bti.out-a -e0x4000h－Boot－Bootorg PARALLEL－ｍｅｍｗｉｄｔｈ１６－romwidth １６－ｏ Bti.hex

生成Ｂ核的16位并行ＥＰＲＯＭ工作方式的Boot表。

在实现双核DSP的上电自举后，Ａ核和Ｂ核的用户程序将会被存放在核内程序空间的不同页面上。如从ＤＭＡ的角度观看：Ａ核的用户程序将被存放在Ａ核的程序空间的第０页上；Ｂ核的用户程序将被存放在Ｂ核的程序空间的第２页上。因此Ａ核的Boot表不需要修改，而Ｂ核的Boot表中的所有存放页地址的表项中的内容要更改为２。

（3）FLASH编程实现

根据FLASH芯片的控制时序，编写一个简单的DSP程序，用于将Ａ核的Boot表写入FLASH的低６４Ｋ，将Ｂ核的Boot表写入FLASH的高６４Ｋ。

3上电试验结果

将电路上电后，Ａ核控制的发光二极管开始闪烁，Ｂ核控制的发光二极管也开始闪烁，且Ａ核发光二极管闪烁频率要低于Ｂ核发光二极管闪烁频率。由此现象可得出？Ａ核与Ｂ核的BootLoader实现成功，未产生片外总线冲突；Ａ核以２Ｈｚ的频率点亮发光二极管，Ｂ核以１０Ｈｚ的频率点亮发光二极管。

编辑：jq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉