本文探讨了医疗成像算法的当前趋势、成像模式的融合和实现这些算法的可扩展平台。现场可编程门阵列为可扩展CPU平台提供数据采集和协处理支持,使得更复杂的成像成为可能。
医学成像技术在医疗保健领域发挥的作用越来越重要。这是因为医疗保健行业正在努力检查出—甚至预测出—尚处在早期阶段的疾病并积极推行无创性治疗,并与此同时降低诊断和治疗成本。诊断成像模式的融合与成像算法开发方式及进展相结合是推动开发能实现上述目标的新仪器的主要因素。
为了提供能满足这些医疗保健行业目标所需要的功能,设备开发商正在转向可扩展的、商业现货供应(COTS)的中央处理单元(CPU)平台,这些平台支持现场可编程门阵列(FPGA)用于数据采集和协处理。要高效地开发灵活、可扩展的医疗影像设备,设备开发商必须考虑若干因素。这些因素包括成像算法的开发,多个成像技术的协同使用(成像模式的融合)以及平台的可扩展性。
成像算法的开发需要用到高级直观的建模工具,用于数字信号处理算法的持续改进。这些先进的算法要求可扩展的系统平台,可以显着地提高图像处理性能。这些可扩展的平台应该可以让更小型的、更方便携带的设备得以实现。
要实现近实时分析,系统平台必须和软件(CPU)和硬件(可配置的逻辑门的数量)相匹配。这些处理平台必须满足不同的性能价位,并且必须能够应对多种成像技术间的不同要求。 FPGA可以很容易地被集成到多核CPU平台,为非常灵活的系统提供DSP处理能力,实现最高性能。
系统架构和设计工程师必须快速区分这些平台上的算法,然后运用高级开发工具和知识产权(IP)库对其进行调试。这一过程加速了平台部署,从而实现了制造商利润的最大化。
算法开发
应从每种成像模式的成像算法中的趋势分析开始探讨,包括考虑如何使用FPGA和IP。
磁共振成像(MRI)生成人体的横截面图像。利用FPGA实现的三个功能被用来重建来自截面的三维体。首先,快速傅里叶变换(FFT)生成灰度2 D切片,通常为矩阵,来自频域的数据。然后,三维体的重建涉及切片之间的插值,以产生一个片间距来近似像素间的间距,这样就可以从任何2D平面看到图像。接着,进行迭代分辨率锐化。这个功能采用一种基于一个迭代反向滤波过程的空间去模糊技术,从而在降低噪声的同时使图像结构被重新聚焦。因此,截面的整体视觉诊断分辨率被大大提高。
超声(成像)。超声图像有颗粒存在是一种被称为散斑(speckle)的现象。散斑是由于不同的独立散射物质(类似无线领域的多路无线电频率反射)的相互作用所导致,并且是倍增的性质。超声图像可通过有损压缩的方法来消除斑点。首先,取图像的对数;散斑噪声变成和有效信号相加。然后,通过JPEG2000编码器采用小波有损压缩将噪音最小化。
X光。状动脉X光成像的运动修正是一种将心脏呼吸循环—呼吸和心脏跳动—对成像的影响降到最小的算法。3D+时间的冠状动脉模型的运动被投射到2D的X光图像,支持对去扭曲功能(平移和放大)---校正这种运动并得到更清晰的图像的计算。
分子成像。分子成像是对细胞和分子级生物过程的表征和测量,其目的是检测并捕捉病变细胞和分子的图像,并监测之。例如,可以将X光成像,正电子发射断层扫描(PET)和单光子发射计算机计算断层成像(SPECT)组合用于器官功能、细胞和分子的低分辨率图像,在相对应解剖特征的分辨率低至0.5mm的情况下。设备更加小型化的趋势和对新算法的探索推动使得性能超出了多核CPU的性能,并使得这些紧凑的系统必须采用FPGA技术。
成像模式的融合。实现早期疾病诊断和无创性治疗推动着成像技术的结合,例如,在PET /电脑断层扫描(CT)系统和x光治疗/CT设备中可见到上述情况。要满足当前的性能要求,需要更高分辨率的图像,这要求用于精巧的几何微阵列探测器加上FPGA来对光子和电子信号进行预处理。在预处理完成后,这些信号被CPU和FPGA协处理器组合进行综合和处理,从而生成详细的身体图像。
非实时(NRT)图像的融合,或图像配准,通常被用在将成像于不同时间的器官功能图像和解剖图像进行排列对比。然而,由于患者位置的变化、扫描基础轮廓的不同、以及患者内部器官自然而然的运动等原因,NRT图像配准是存在问题的。采用FPGA处理对PET和CT实时融合,允许器官功能图像和解剖图像在一次成像期间都被采集并且融合,而不是像过去在后期将图像叠加。融合后的图像可以为手术治疗提供更好的清晰度和定位精度。
在手术期间用于指导医生的图像处理包括将手术前的CT或MRI图像与实时3D超声或X光图像进行配准,以促进无创治疗(如超声波、磁共振干扰和x光治疗)的应用。在这一领域,各种算法被开发用于为某些特定的成像模式和治疗组合提供优化的图像配准结果。
在这一类融合式组合系统中,配置有高速串行互连的FPGA可以缩减将数据采集功能连接到系统后处理部分的互连要求,通过省去额外的电路板和电缆,大大地降低了整体系统的成本。
成像算法
有好几种不同的成像算法被常用于FPGA中。这些算法包括增强、稳定、小波分析和分布矢量处理。
图像增强算法通常用到卷积或线性、滤波。高通滤波图像和低通滤波图像进行线性组合,通过矩阵乘法加权,可生成一幅细节增强而噪音降低的图像。
视频图像的稳定包括视频数据序列的规范化旋转和缩放效果,以最终达到连续帧之间噪音的平衡。此外,该算法平滑了从视频中提取的静态图像的锯齿边缘,并可将图像抖动校正至约十分之一个像素。
小波分析算法设计用于帮助获取信号内的事件信息,小波分析算法采用窗口技术——通过变化窗口的大小——来分析信号的一小段。为了获得更高的精确性,小波分析允许对低频信息采用较长的时间间隔,而对高频信号采用更短的时间间隔。小波分析算法的应用包括不连续点和断点的检测、自相似性检查、信号抑制、信号或图像的降噪、图像压缩和大型矩阵的快速相乘。
近期取得进展的S变换算法结合了FFT和小波变换的优点。它揭示了空间和时间上的频率变化。这一功能的应用包括纹理分析和噪声滤波。S变换算法属于一种密集型计算,会使得传统CPU的执行速度变得很慢。分布式向量处理可以解决这个问题,通过在FPGA内部将向量和并行计算相结合,使得处理时间可缩短25倍。
早期癌症检测的一种方法是利用了恶性肿瘤会调动新血液供应的功能。数字传感器检测到由病人身体释放出的红外线能量。因此,它可以检测到因癌症引起的血流量增加与正常情况的细微差别。这一功能的典型应用是基于一个可编程脉动列阵,通过一个通用工作站和一个基于FPGA的专用硬件引擎来实现。 FPGA引擎可将核心算法加速至近1000倍于一个目前最新工作站所能达到的速度。
对于这些复杂的成像算法而言,多FPGA模块部件功能是必须的。例如,CT重建需要插值、快速傅立叶变换和卷积等功能。在超声成像领域,处理方法包括彩色流处理、卷积、波束形成和弹性估计等。通用成像算法包括诸多类似的功能,如色彩空间转换、图形叠加、2D中值滤波、缩放、帧和场的转换、对比度增强、锐化、边缘检测、阈值、平移、极性和笛卡尔转换、非均匀性校正和像素置换等。
可扩展平台
在过去,许多成像系统被作为成专有计算机系统来打造。但随着当前高性能的商用现货供应(COTS)的CPU板的出现,系统工程师能够以更具创造性的方式来实现设计。虽然许多算法的NRT处理过程单单就软件而言是可以接受,但是实时图像处理仍需要硬件的辅助。当前的FPGA内置有DSP模块、高带宽的内存模块、以及大型可编程阵列等,是非常适合提供这类硬件辅助的硬件设备。
Altera公司(圣何塞)一直与其合作伙伴紧密合作以提供FPGA协处理资源+COTS CPU解决方案的组合。对于来自英特尔公司和AMD公司的单板机(SBC),Altera公司的内置有串行器-解串器的Stratix II GX FPGA可以直接运行PCI Express兼容协处理器板用于算法卸载。对于AMD公司的带有双插槽的单板机,XtremeData公司(美国伊利诺斯州、绍姆堡)提供了一个可直接插入AMD皓龙处理器的插座的协处理器子卡,提供了一个一流的CPU+FPGA处理解决方案(见图1)。一个四插槽的AMD单板机可提供多个CPU+FPGA协处理器的组合(1 +3,2 +2或3 +1),用以提高算法密集型应用的性能。但可以通过使用多个1U服务器刀片实现最终的平台可扩展性,每个1U服务器刀片执行CPU+FPGA协处理器解决方案。
这些平台的应用增速效果取决于算法:一个算法中可以加载到FPGA中的并行计算越多,整体的执行速度就越快。例如,当对一个CT成像算法采用基于FPGA硬件的加速——给每个CPU(3 GHz)加上一个FPGA协处理器时,整个应用程序的执行速度快了10倍。结果就是,系统的功耗、尺寸以及成本明显地下降。
开发方法学
讨论自然地包括对开发算法的方法以及相应的算法执行工具的考虑。
算法工具。成像系统架构师们使用高级软件工具来对不同的算法建模,并对所取得的结果进行评估。先进的数字信号处理通用工具是来自MathWorks公司(美国、马萨诸塞州、内蒂克)的MATLAB处理引擎和Simulink仿真器图形用户界面。大多数OEM(原始设备制造商)和医疗设计室利用MATLAB来开发快速、精确的算法,如数字图像处理、定量图像分析、模式识别、数字图像编码和压缩、刑侦图像处理和2D小波变换。除了算法开发之外,MATLAB可以被用来模拟在FPGA普遍采用的定点算法,并带有可选工具包,可以生成运行在通用CPU或FPGA内的C代码。
算法的划分和调试。一旦算法开发完成,系统架构师必须决定如何划分CPU和FPGA的功能,以提供最佳的整体解决方案——能够平衡性能、成本,可靠性和寿命的解决方案。设备构架师抱怨说,对一个高性能硬件系统中诸多单元进行算法划分和调试是一种挑战。在过去上,许多设计在FPGA中采用流水线的方法。也就是说,算法被分为成各种功能并在一个有顺序的流水线中执行。调试流水线的运行占了集成工作内容的90%。因为每个函数的执行时间必须针对最大计算处理量进行平衡,并且局部存储器的可见性和延时是受限制的事实,使得事情变得很难。
解决方案是一个更以软件为中心的系统设计。这个系统是基于一个分布式协处理器计算模型,在该模型内,每个功能的协处理器是一个执行机(例如,一个功能性子处理器),其具有基于消息的、用于在子处理机之间传递控制和数据消息的能力。在所有内存、CPU和子处理机之间的完全切换,提供了完整的可观测性,使得调试变容易。消息传递在内部存在于FPGA子协处理器之间;在外则出现在系统内的其它CPU和协处理器之间。
Altera公司的FPGA内部的Avalon 开关结构和可编程片上系统(SOPC)集成工具在所有功能单元之间自动生成灵活的交叉开关结构。经预先测试的IP提供了从FPGA到主机CPU和从FPGA到双列直插内存模块(DIMM)内存的接口。经预先测试的消息网络基础设施支持主机CPU、FPGA子处理机,以及FPGA内存控制器之间的通信控制。一个简化的调试方法是将消息和完全开关相结合,使得开发过程中具有最大的灵活性。最后,可在执行过程中对数据通道进行软件定义(重新定义),这样可以拦截数据或对其重新导向,从而提高系统集成和调试过程中的可观测性。
设计工具和IP。虽然MATLAB这样的工具可以优化用于采用软件进行算法的开发,但其尚不支持在FPGA中的执行。设计人员可以通过采用电子设计自动化(EDA)工具和IP来加快其在FPGA上的实现。
视频和图像处理套件以及DSP库提供了可加速复杂成像算法的开发和实现的IP积木式模块。视频和图像处理模块组,和其它IP模块及参考设计(包括同相/正交(IQ)调制解调器、JPEG2000压缩算法、快速傅立叶变换/逆傅里叶变换,以及边缘检测等)为设计人员提供了广泛的IP,设计人员可以利用这些IP迅速地完成计算密集型任务的FPGA实现。
结论
随着当年婴儿潮时期人口的老龄化,正在努力寻找针对诸如心脏病和癌症这类极其常见疾病的新诊断和治疗方法,包括早期检测以及微创手术治疗。各种诊断成像技术结合和相关算法开发的新进展推动了新设备的开发以满足这些病人的需要。先进的算法需要可以显着提高图像处理性能的可扩展系统平台。
被集成进至COTS多核CPU平台的FPGA,为最灵活、最高性能的系统提供了强大的数字信号处理功能。为了帮助加快这些复杂成像算法在这些平台上实现,需要高级开发工具和IP库。有关软件工具和IP库已被开发出来。
评论
查看更多