产前超声检查能够有效预防和降低出生缺陷,受到了越来越多家庭的重视。然而传统的产前超声检查对于医师的专业能力要求较高,且耗时耗力。针对这些问题,深圳开立生物医疗科技股份有限公司(以下简称:开立医疗)推出了基于人工智能(AI)技术的 S-Fetus 4.0 产科扫查助手1,能够有效简化工作流程,减轻医师负担,并为患者提供更好的诊疗服务。
为提升性能表现,开立医疗在基于英特尔 酷睿 i7 处理器的平台上使用英特尔 oneAPI Base 工具包进行跨架构开发与优化,从而实现更高的经济性、跨架构扩展性和灵活性。
背景
智能超声诊断面临诸多挑战
超声诊断是一种将超声检测技术应用于人体,通过测量了解生理或组织结构的数据和形态,进而发现疾病、做出提示的一种诊断方法2,现已成为人类疾病诊疗、尤其胎儿产前筛查重要的影像学诊疗手段。但是,传统超声检查高度依赖医师经验水平,且手动操作效率低下,给医师和医院带来诸多困扰。
为解决上述问题,开立医疗推出基于人工智能技术的智能诊断超声解决方案,在方案开发过程中遇到了如下挑战:
1
如何进一步优化性能
相关的深度学习算法众多且需要协同工作,以帮助医疗机构快速处理不同数据类型的任务,并根据场景无等待地最优执行用户发起的任务。这对于超声终端的算力、算法优化均带来了较高要求。
2
如何应对移动应用需求
目前搭载了 S-Fetus 4.0 产科扫查助手的开立医疗超声诊断系统为移动型系统,对于系统整体的功耗、尺寸有着较高的限制,这给独立 GPU 的部署带来了很大的挑战。
3
如何面向不同场景实现跨架构扩展
S-Fetus 4.0 产科扫查助手需要跨多种架构进行迁移和扩展,以应对多种复杂场景。
解决
使用英特尔 oneAPI工具包
优化超声诊断
为应对上述挑战,开立医疗与英特尔合作,探索通过英特尔 oneAPI Base 工具包对 S-Fetus 4.0 产科扫查助手进行优化。
硬件层面
在硬件层面,方案采用了基于第 11 代英特尔 酷睿 i7 处理器的算力基础架构。该处理器实现了更出色的执行性能,搭载全新内核和显卡架构,并具备基于人工智能的智能性能,能够为各种工作负载提供卓越性能。该处理器具备英特尔 深度学习加速(英特尔 DL Boost)技术,可为 AI 引擎提供强大支持,为人工智能、数据分析等多种复杂负载提供出色的性能支撑。
第 11 代英特尔 酷睿 处理器还集成了英特尔锐炬 Xe 显卡,充分利用该集成显卡来提升工作负载的性能。此外,这一显卡还能够支持多种数据类型,并采用了低功耗架构。
解决方案的数据处理流程如图 1 所示。其中英特尔锐炬 Xe 显卡提供数据密集计算核,负责实时识别追踪流程,实现高频实时执行(每一帧图像都要进行处理或智能推理)。英特尔 酷睿 i7 处理器负责标准面决策及调度、自适应切面特征提取、量化分析等流程,执行业务逻辑或空闲期执行 AI 推理。
图1 基于英特尔 酷睿 处理器的
开立医疗 S-Fetus 4.0 产科扫查助手方案架构图
软件工具优化
多模态数据优化处理作为一个数据密集与逻辑判断相结合的模块,开立医疗与英特尔使用英特尔 oneAPI 工具包,重点针对这一环节进行了 4 个方面的优化。优化后,开立医疗 S-Fetus 4.0 产科扫查助手可以灵活调用 CPU 和 iGPU 的资源,大幅提升了性能,在满足业务需求的同时,改善了超声用户体验。
■ 优化一
开立医疗使用英特尔 VTune Profiler 对工作负载进行分析,随后通过英特尔 oneAPI 工具包中的 DPC++ 编译器对代码进行重新编译并生成向量化指令以提升性能。通过这种方式,将工作负载的处理速度从 141ms 大幅缩短到 33ms3。
图2 标量操作 Vs 向量操作
■ 优化二
通过英特尔 VTune Profiler 进一步发现性能瓶颈后,开立医疗使用英特尔 Integrated Performance Primitives(英特尔 IPP)中的 API 对其进行替换。通过这一步骤的优化,开立医疗将工作负载的处理速度从 33ms 进一步缩短到 13.787ms4。
■ 优化三
通过使用英特尔 IPP 替换源码中的 openCV 函数,应用代码在各代英特尔平台上均能够很好地运行,并在大规模数据场景下表现出更好的可扩展性。
■ 优化四
S-Fetus 4.0 产科扫查助手应用了英特尔 DPC++ Compatibility Tool,将现有的 CUDA 代码高效地迁移到DPC++ 代码,从而实现跨架构运行,大幅缩短了代码迁移时间
图3 英特尔 DPC++ Compatibility Tool 工作流程图
通过上述优化,开立医疗 S-Fetus 4.0 产科扫查助手在基于英特尔 oneAPI DPC++ 的异构平台上的性能较优化前的基准性能数据,实现了近 20 倍的性能提升(具体性能数据见图 4)5。
图4 使用英特尔 oneAPI 异构平台优化前后的性能对比6
收益
卓越的性能与跨架构扩展能力
通过采用集成英特尔锐炬 Xe 显卡的英特尔 酷睿 处理器提供底层算力,并使用英特尔 oneAPI 异构平台进行优化,开立医疗 S-Fetus 4.0 产科扫查助手实现了性能、经济性和异构扩展性等方面的兼顾:
● 高性能:通过基于英特尔 oneAPI 工具包的英特尔 XPU 混合架构开发,开立医疗 S-Fetus 4.0 产科扫查助手实现了近 20 倍的性能提升,为高效的产科智能超声诊断奠定了坚实的基础7。
● 更优成本:得益于英特尔 酷睿 处理器的强大性能和灵活架构,以及全方位的优化,开立医疗只需使用 CPU + iGPU就可以实现预期的性能指标。同时,由于硬件的精简,供电、散热、空间等成本显著降低,使得其可以搭载在尺寸更小的超声诊断设备中,更灵活地应对不同场景的需求。此外,CPU + iGPU 的组合也意味着更持久的电池续航时间,以及更高的稳定性与可靠性。
● 异构扩展性:该方案能够在 CPU、iGPU 等异构化硬件上进行统一编程,有效提升跨架构编程的开发效率,支持开立医疗 S-Fetus 4.0 产科扫查助手灵活地在不同的硬件配置中运行,同时确保流畅的用户体验。
展望
加速 “AI + 医疗” 的落地
智能超声诊断是 “AI + 医疗” 的重要场景,有助于大幅减少医生工作量,提升医疗业务流程效率。为了推动 “AI + 医疗” 技术的落地,英特尔正在与开立医疗等伙伴合作,通过包含 CPU、iGPU、专用加速器以及 FPGA 的 XPU 混合架构,以及英特尔 oneAPI 工具包等软硬件产品,加速数字化创新,推动更多智慧化产品与方案在医疗行业的落地。
审核编辑 :李倩
-
英特尔
+关注
关注
61文章
9946浏览量
171682 -
智能化
+关注
关注
15文章
4867浏览量
55340 -
人工智能
+关注
关注
1791文章
47164浏览量
238145
发布评论请先 登录
相关推荐
评论