资料介绍
深入理解某个应用的数据访问方式,可以充分利用处理器潜在架构中的存储器和系统资源,从而开发可扩展的并行应用。
基于单核结构的嵌入式处理器越来越不能满足日益增长的嵌入式多媒体处理应用方面的要求,多核嵌入式结构已成为解决这一问题的有效途径,同时也为如何开发充分利用多核结构的应用软件带来挑战。目前,需要将编译技术和开发工具更多的结合起來,才能使多核结构的应用获得成功。而大多数并行软件都是通过手工转换方式将顺序程序转换为并行程序来实现的。由于缺乏具有多核意识的开发工具,使得软件难以进行性能评估。因此,如果没有预先有效可靠的工程规划,将不得不面对应用软件的效率低下,以及延迟产品上市时间等问题。
软件框架为多核应用软件的开发提供了一个很好的起点,可以帮助缩短开发时间。本文将详细说明嵌入式多媒体应用软件的设计框架,同时,本文的数据流模型也可扩展到许多其它应用中。该框架综合了多媒体应用软件固有的数据并行结构,还说明了如何通过有效使用潜在架构来有效管理数据流。
在设计并行软件的过程中有两大挑战:一是开发一个有效的并行算法,二是有效利用存储器,如DMA(直接存储访问)通道和互连网络等共享资源。在这过程中,顺序运行的应用程序的性能可根据可用处理器核的数目进行扩展。
通常实现应用程序的并行处理有多种方法。有些应用程序表现为固有的并行,而有的则具有相当复杂且不规则的数据存取模式。但总的来讲,科学应用程序和多媒体应用程序的并行通常易于实现,因为它们的数据存取模式比那些控制类应用程序相对容易预测。本文重点讨论针对多媒体算法的并行技术,这类算法需要很高的处理开销,且常用于嵌入式系统应用中。
多媒体应用程序中存在数据的并行级别。一组数据帧和数据帧中的一个宏块之间的并行粒度有很大差别。通常来讲,粒度越小,在共享单元——例如处理器核和DMA通道——之间所需的同步级别越高。粒度越小,并行程度也就越高,而网络通信量也越小。相反,大的粒度则要求较低的同步性,但也使网络通信量增大。因此,基于应用的不同类型和系统需求,软件框架也定义了不同的并行级别。
需要说明的是,对可扩展并行软件的开发还依赖于对互连网络、分级存储器体系,以及外设/DMA资源的有效利用。系统严格的低功耗和低成本的需求对所有这些要素都会构成约束。多核环境下的设计要求改革资源的有效利用方式。本文介绍了几种在ADI公司的Blackfin ADSP-BF561双核处理器上对资源进行有效管理的方法。
多媒体数据流分析
为了实现数据并行,需要在数据流中找到这样一个或一组数据块:能够独立处理并将结果馈送给另外的处理部件。独立的数据块可以降低同步开销并简化并行算法。要找到这种数据块,重要的是要清楚数据流模式,或者一个应用的数据存取模式。
对于大多数多媒体应用,可以将数据存取模式看成是2-D(空间域)和3-D(时间域)操作模式。在2-D模式中,独立的数据块被限制在单个数据帧内,而在3-D模式中,独立数据块可以跨越多帧。在空间域中,可以将帧划分用N个连续行和视频帧宏块组成的片段,而在时间域中,可以对数据流进一步细分到帧级或图片组(GOP)级。
采用片段或宏块的数据存取模式的算法对同步性要求很高,但需要较少的网络传输量,这是因为分级的存储器体系只需存储图像数据的一部分。对于帧或图片组类型的数据访问模式,分级的存储器体系则需要存储大量数据,但对同步性的要求则相对低得多。这是因为系统的并行粒度增大了的缘故。图1说明了多媒体应用软件中的并行级别,同时对四个级别中相关的同步性和网络通信量做了对比。
图2说明了ADSP-BF561的结构,该结构的组成中包括独立的指令和数据存储器,分别属于两个处理器核专有。该结构还包括共享的L2存储器和外部存储器,用户利用可配置的仲裁方案将所有的外围设备和DMA资源连接到任一处理器核上。ADSP-BF561 有两个DMA处理器,每个都由两组MDMA(存储器-DMA)通路组成。L2存储器和每个处理器核之间都通过独立的总线连接,而外部存储器和两个处理器核之间则由一条共享总线连接。
基于单核结构的嵌入式处理器越来越不能满足日益增长的嵌入式多媒体处理应用方面的要求,多核嵌入式结构已成为解决这一问题的有效途径,同时也为如何开发充分利用多核结构的应用软件带来挑战。目前,需要将编译技术和开发工具更多的结合起來,才能使多核结构的应用获得成功。而大多数并行软件都是通过手工转换方式将顺序程序转换为并行程序来实现的。由于缺乏具有多核意识的开发工具,使得软件难以进行性能评估。因此,如果没有预先有效可靠的工程规划,将不得不面对应用软件的效率低下,以及延迟产品上市时间等问题。
软件框架为多核应用软件的开发提供了一个很好的起点,可以帮助缩短开发时间。本文将详细说明嵌入式多媒体应用软件的设计框架,同时,本文的数据流模型也可扩展到许多其它应用中。该框架综合了多媒体应用软件固有的数据并行结构,还说明了如何通过有效使用潜在架构来有效管理数据流。
在设计并行软件的过程中有两大挑战:一是开发一个有效的并行算法,二是有效利用存储器,如DMA(直接存储访问)通道和互连网络等共享资源。在这过程中,顺序运行的应用程序的性能可根据可用处理器核的数目进行扩展。
通常实现应用程序的并行处理有多种方法。有些应用程序表现为固有的并行,而有的则具有相当复杂且不规则的数据存取模式。但总的来讲,科学应用程序和多媒体应用程序的并行通常易于实现,因为它们的数据存取模式比那些控制类应用程序相对容易预测。本文重点讨论针对多媒体算法的并行技术,这类算法需要很高的处理开销,且常用于嵌入式系统应用中。
多媒体应用程序中存在数据的并行级别。一组数据帧和数据帧中的一个宏块之间的并行粒度有很大差别。通常来讲,粒度越小,在共享单元——例如处理器核和DMA通道——之间所需的同步级别越高。粒度越小,并行程度也就越高,而网络通信量也越小。相反,大的粒度则要求较低的同步性,但也使网络通信量增大。因此,基于应用的不同类型和系统需求,软件框架也定义了不同的并行级别。
需要说明的是,对可扩展并行软件的开发还依赖于对互连网络、分级存储器体系,以及外设/DMA资源的有效利用。系统严格的低功耗和低成本的需求对所有这些要素都会构成约束。多核环境下的设计要求改革资源的有效利用方式。本文介绍了几种在ADI公司的Blackfin ADSP-BF561双核处理器上对资源进行有效管理的方法。
多媒体数据流分析
为了实现数据并行,需要在数据流中找到这样一个或一组数据块:能够独立处理并将结果馈送给另外的处理部件。独立的数据块可以降低同步开销并简化并行算法。要找到这种数据块,重要的是要清楚数据流模式,或者一个应用的数据存取模式。
对于大多数多媒体应用,可以将数据存取模式看成是2-D(空间域)和3-D(时间域)操作模式。在2-D模式中,独立的数据块被限制在单个数据帧内,而在3-D模式中,独立数据块可以跨越多帧。在空间域中,可以将帧划分用N个连续行和视频帧宏块组成的片段,而在时间域中,可以对数据流进一步细分到帧级或图片组(GOP)级。
采用片段或宏块的数据存取模式的算法对同步性要求很高,但需要较少的网络传输量,这是因为分级的存储器体系只需存储图像数据的一部分。对于帧或图片组类型的数据访问模式,分级的存储器体系则需要存储大量数据,但对同步性的要求则相对低得多。这是因为系统的并行粒度增大了的缘故。图1说明了多媒体应用软件中的并行级别,同时对四个级别中相关的同步性和网络通信量做了对比。
图2说明了ADSP-BF561的结构,该结构的组成中包括独立的指令和数据存储器,分别属于两个处理器核专有。该结构还包括共享的L2存储器和外部存储器,用户利用可配置的仲裁方案将所有的外围设备和DMA资源连接到任一处理器核上。ADSP-BF561 有两个DMA处理器,每个都由两组MDMA(存储器-DMA)通路组成。L2存储器和每个处理器核之间都通过独立的总线连接,而外部存储器和两个处理器核之间则由一条共享总线连接。
下载该资料的人也在下载
下载该资料的人还在阅读
更多 >
- ADSP-BF561:Blackfin嵌入式对称多处理器数据手册
- Blackfin双核嵌入式处理器
- 嵌入式教程之嵌入式实时操作系统RTEMS的详细资料介绍 27次下载
- 嵌入式处理系统4_多DSP系统入 8次下载
- 面向异构多处理器设备的自适应命令解释系统 0次下载
- 嵌入式多媒体多核应用软件设计解析 0次下载
- 嵌入式RISC微处理器核设计研究
- 嵌入式多媒体应用的多核编程框架 29次下载
- 为嵌入式系统选择合适的多处理器 28次下载
- 嵌入式异构多处理器系统中的通信实现 47次下载
- 嵌入式处理器选型 64次下载
- 用多处理器系统级芯片解决手机的多媒体任务需求 82次下载
- 双内核嵌入式处理器OMAP5910及其在3G的多媒体应用
- 多处理器分组实时调度算法
- 嵌入式多媒体视频安全系统设计
- 什么是嵌入式微处理器?嵌入式微处理器有哪些? 729次阅读
- 嵌入式微处理器的原理和应用 588次阅读
- 嵌入式处理器简介和种类 794次阅读
- 基于多处理器系统的串行通信方式研究 1927次阅读
- 基于处理器PXA255和Linux操作系统实现多媒体终端对视频应用的设计 2981次阅读
- 基于全志A20 1.2GHz双核处理器的多媒体发布系统 5398次阅读
- 嵌入式处理器的种类有哪些 2w次阅读
- 关于嵌入式处理器的在线调试方法 1153次阅读
- Intel嵌入式处理器的相关基础知识 1203次阅读
- 嵌入式应用框架EAF详解 2699次阅读
- 液晶显示屏设计方案:基于Nios嵌入式软核处理器 1081次阅读
- 基于SoPC 技术的片上嵌入式Nios Ⅱ软核六处理器系统 987次阅读
- 嵌入式处理器汇总_常见的嵌入式处理器对比分析 1.4w次阅读
- 详析32位嵌入式处理器与8位处理器应用开发的三大不同 1155次阅读
- 32位嵌入式处理器与8位处理器应用开发的区别 1528次阅读
下载排行
本周
- 1TC358743XBG评估板参考手册
- 1.36 MB | 330次下载 | 免费
- 2开关电源基础知识
- 5.73 MB | 6次下载 | 免费
- 3100W短波放大电路图
- 0.05 MB | 4次下载 | 3 积分
- 4嵌入式linux-聊天程序设计
- 0.60 MB | 3次下载 | 免费
- 5基于FPGA的光纤通信系统的设计与实现
- 0.61 MB | 2次下载 | 免费
- 6基于FPGA的C8051F单片机开发板设计
- 0.70 MB | 2次下载 | 免费
- 751单片机窗帘控制器仿真程序
- 1.93 MB | 2次下载 | 免费
- 8基于51单片机的RGB调色灯程序仿真
- 0.86 MB | 2次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 2555集成电路应用800例(新编版)
- 0.00 MB | 33564次下载 | 免费
- 3接口电路图大全
- 未知 | 30323次下载 | 免费
- 4开关电源设计实例指南
- 未知 | 21548次下载 | 免费
- 5电气工程师手册免费下载(新编第二版pdf电子书)
- 0.00 MB | 15349次下载 | 免费
- 6数字电路基础pdf(下载)
- 未知 | 13750次下载 | 免费
- 7电子制作实例集锦 下载
- 未知 | 8113次下载 | 免费
- 8《LED驱动电路设计》 温德尔著
- 0.00 MB | 6653次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935054次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537796次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420026次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191185次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183278次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138040次下载 | 免费
评论
查看更多