“联邦学习”或将推动AI在医疗行业加速落地？-电子发烧友网

AI正在各个行业掀起渐进式的变革，医疗一直是其中的热门领域，被业界认为有可能尽快实现产业化。

AI+医疗的快速发展，离不开迅速增长的医学大数据规模、快速提升的算力和理论基础的进展。进一步分析，从资本层面来看，AI+医疗有较好的投资盈利预期，受到了资本的追捧；从技术和人才角度来看，医疗AI的研究机构众多，包括科研单位、高校、大型企业、创业企业等，造就了一大批奋战在一线的科研机构，相应的技术和人才水平较高；具体到细分应用，特别是在医学图像识别领域，拥有丰富的技术和设备等资源。

医疗影像面临的数据挑战

AI在医疗产业的发展，最初是数据收集，主要是通过多种工具或设备来收集人体的健康数据，医疗影像是其中之一，也是迄今为止AI在医疗行业落地最为成熟的应用之一。随着医疗信息化和生物技术不断地发展，医疗数据的类型和规模正以前所未有的速度快速增长。

在医疗AI领域，获取高质量的医学影像数据难度较大。一方面来自于医学影像数据前处理和标注所需的投入，占据了开发成本的绝大部分，工作量巨大；其次，随着现代医学影像技术的发展，医学影像数据的产生技术也变得越来越复杂，客观上加大了数据的获取和使用难度；同时，由于医学影像数据绝对的私密性，数据的拥有方采取高度保护措施，也加大了AI研发机构获取数据的难度。

只有获取更多的数据进行训练，AI模型才能更强健。而眼下这些现状，显然有碍于深度学习理论下AI模型的进展。

“联邦学习”——打破数据壁垒，保护隐私数据

日前，在全球高端的医学影像会议MICCAI召开期间，NVIDIA携手伦敦国王学院推出了用于医学影像分析、且具有隐私保护能力的联邦学习系统( federated learning system)。据了解，该实验基于取自BraTS 2018数据集的脑肿瘤分割数据而实施，包含了285位脑肿瘤患者的MRI扫描结果，采用了NVIDIA V100 Tensor Core GPU用于训练与推理。

NVIDIA医疗副总裁Kimberly Powell与NVIDIA资深研究科学家Nicola Rieke介绍了联邦学习系统的技术细节、实施前景及研究背景。

右一：NVIDIA医疗副总裁Kimberly Powell
左一：NVIDIA资深研究科学家Nicola Rieke

联邦学习(federated learning)是一种能够让开发者与各企业机构利用分散在多个位置的训练数据，对中心深度神经网络（DNN）进行训练的学习范式，该方法可以支持各企业机构针对共享模型开展协作，而无需共享任何临床数据。

NVIDIA最新发布的论文中，对这一数据训练方式表述为：“联邦学习在无需共享患者数据的情况下，即可实现协作与分散化的神经网络训练。各节点负责训练其自身的本地模型，并定期提交给参数服务器。该服务器不断累积并聚合各自的贡献，进而创建一个全局模型，分享给所有节点。”

一言蔽之，“联邦学习系统”最大的突破，在于它的运行方式是——模型找数据，而非数据找模型。如下图所示，最左边的“全局AI模型”可以分散到各个医院或研究中心，利用它们本地的数据进行训练，之后再将训练后的模型回传，而数据始终保存在本地。通过各个医院、研究中心等机构不断地训练，“全局AI模型”不断壮大，再分享给各个节点，实现了数据与模型训练的“双赢”。

由于无需上传病人的隐私数据，大大打消了数据拥有方对于隐私数据的顾虑。但是，这一系统是否足够安全？有无被通过“反推”方式破解数据的风险？

Nicola Rieke对<电子发烧友>表示，通过模型反演、设法使数据重现的手段已在研究考量中，因为如果知道底层的运行逻辑，不排除会有一些反推手段。为了提高联邦学习的安全性，研究人员试验了使用ε-差分隐私框架的可行性。该框架是一种正式定义隐私损失的方法，该方法可以借助其强大的隐私保障性来保护患者与机构数据。据Nicola Rieke介绍，相当于完成模型训练之后，加入“噪点”使数据变得模糊，改变了原有数据的颗粒度，使得反推更加困难。

“联邦学习”VS.“集中化数据处理”

Kimberly Powell进一步谈到了联邦学习系统的价值所在。她提到，在当前很多AI的研究或项目中，大量的工作离不开“数据收集”，各个国家都在进行相应的工作。但是涉及跨国或是跨区域的合作，大家几乎不可能共建一个数据池进行分享，因此数据壁垒愈发凸显。这时“联邦学习系统”就能够发挥作用了。

通过深度学习从数据中自动提取知识，再运用“联邦学习”有效聚合各机构从私有数据中本地习得的知识，能够进一步提高深度模型的准确性、稳健性与通用化能力。

与集中化的数据处理方式相比，联邦学习所提供的方法可以在不共享机构数据的情况下实现相当大的分割性能。试验结果显示，隐私保护与受训模型质量之间产生了自然折中。而且，通过使用稀疏向量技术，联邦学习系统可以实现严格隐私保护，且对模型性能仅产生合理的轻微影响。

另外就是集中化的数据处理方式，相当于将数据量增加了一倍。例如1TB 的CT图象，将它集中起来进行训练，需要把这1TB数据进行拷贝再做转接传输，给整个系统增加了额外的数据负担，对于系统的算力、存储、带宽都是更为严峻的考验。

目前什么样的系统能够采用“联邦学习”？ Kimberly Powell表示，NVIDIA 的GPU硬件基本上对于每个服务器供应商来说都是可以使用的，入门级的投入1万美金即可。NVIDIA与美国放射科学会已经共同打造了一个参考架构，可以应用到各个医院中，如果仅是试用性的训练，用这个架构的第一层就可以了。如果有相对高层级的需求，可能需要从头去打造全新的算法应用。

Kimberly Powell强调，“联邦学习系统”是目前在医疗健康AI领域的突破性进展，该研究为部署安全联邦学习方面做出了巨大的推动，并将广泛推动数据驱动型精准医学的进步。

崛起的医疗AI，进击的NVIDIA

根据公开数据，到2020年医疗数据量将达40万亿GB，数据生成和共享的速度将迅速增长，其中80%以上的数据为非结构化数据。面对如此迅速增长的医疗数据量，不借助AI的提升很难进行甄别和处理。

Kimberly Powell以2017年获得诺奖的一台记录人体蛋白质数据的机器举例，这台机器可以在原子层面记录人体的蛋白质数据，这种新型的探测技术每天收集超过3T数据，可以用于很多医疗研究领域，例如基因组学等等。在接下来的几年中，它所生成的数据会比Facebook、YouTube的数据总和还要多。想象一下全世界范围之内，所有的医院、供应商所产生的数据。

另一方面，就放射科而言，实际的医生数量与需求之间并不匹配，存在着巨大的人员缺口，在美国这一缺口达到50%。Kimberly Powell称，正因为如此，需要将一些工作实现自动化，降低AI的应用门槛。

她认为，2018年是AI在放射科应用的拐点，除了通过AI大幅降低成本，提升图像质量，真正将医疗工作与AI整合在了一起。例如CT设备通过AI实时算法缩短成像时间，生成更多更安全、准确的实时图像；以及探测颅内出血的设备，可以根据实际情况及时帮助医生根据工作优先级调整工作流程等。

根据亿欧智库的研究显示，国内疾病风险预测、医学影像场景下的公司数量最多，占医疗AI公司总数的一半以上，相关产品相对成熟。

也正是看到了AI在医学影像领域的巨大潜力，NVIDIA不断加大在这一细分领域的投入。今年春天，NVIDIA正式发布了Clara。和CUDA一样，Clara的推出是NVIDIA在GPU易用性方面做出的又一努力。但不同于CUDA，Clara面向医疗领域的垂直细分应用，从软件层面帮助开发者在GPU平台部署计算密集型医疗AI应用程序。

由于标记数据对于构建安全可靠的AI至关重要，但放射科医生无法花费数小时来标记数据集。因此Clara具备辅助注释功能，可以加速结构化数据集的创建，从而在几分钟内完成注释。

此外，Clara还具有迁移学习的功能，能够对已有模型进行调整，从而适应本地变量。它能够使用包含本地人口统计的数据和本地影像设备对深度学习算法进行定制，且无需移动或共享患者数据。因此，医生可为自己的患者创建模型，而无需使用10倍的数据量从头开始。

对于初创公司来说，Clara这种可以在官网免费下载的SDK很受欢迎。NVIDIA也在增加更多的加速引擎，帮助他们提升效率，加速方案的部署。此外，Clara也面向针对医疗设备公司、医院等企业客户。

截至目前，这一平台的开发者数量已经增长了4倍。据了解，最新发布的“联邦学习系统” 也会整合到Clara工具平台中。而不论是联邦学习系统还是Clara，都是NVIDIA使AI在医疗行业更为落地的铺垫。作为底层技术赋能者，NVIDIA正在通过软件+硬件的方式，雄心勃勃地进发着。

Kimberly Powell表示，得益于之前在消费级AI的良好基础，NVIDIA能够在医疗AI领域提供面向更复杂应用的开发工具。下一步，针对自动化AI将进行更为深入的研究和投入。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

gpu

gpu

+关注

关注
28

文章
4829

浏览量
129768
医疗

医疗

+关注

关注
8

文章
1846

浏览量
59124
英伟达

英伟达

+关注

关注
22

文章
3872

浏览量
92438

FPGA+AI王炸组合如何重塑未来世界：看看DeepSeek东方神秘力量如何预测......

工作的理解。有AI加持的FPGA工程师不仅不会被人工智能取代，反而能够充分发挥FPGA的灵活性和高效性，在AI时代创造出更具竞争力的解决方案，推动

发表于 03-03 11:21

DeepSeek一体机:加速AI训推超融合,推动行业智能化落地

在人工智能技术迅猛发展的今天，大模型技术正加速从“实验室”迈向“产业场景”，然而数据工程复杂、模型适配难、训练成本高等问题，仍是行业化落地的“拦路虎”。华为DCS

发表于 02-20 11:14 •349次阅读

NVIDIA携手行业巨头，共促医疗健康产业变革

近日，NVIDIA宣布了一系列新的合作伙伴关系，旨在通过前沿技术推动医疗健康与生命科学产业的变革。此次合作，NVIDIA将携手行业内的领先机构，共同

发表于 01-20 14:02 •199次阅读

浅谈AI数据标注对智慧医疗的推动作用

人工智能技术的进步，不断推动着各行各业的智能化发展。人工智能在不同行业的落地应用不仅大大提升了行业从业人员的工作效率，智能决策也在很大程度上

发表于 01-17 17:31 •655次阅读

NVIDIA携手多家机构推动医疗健康产业变革

合作的目标直指规模高达10万亿美元的医疗健康与生命科学产业。NVIDIA将凭借其强大的AI和加速计算技术，助力合作伙伴在药物发现、基因组研究

发表于 01-14 14:28 •1009次阅读

NVIDIA 携手行业领先机构推动基因组学、药物发现及医疗健康行业发展

IQVIA、Illumina、妙佑医疗国际和 Arc 研究所借助 NVIDIA AI 和加速计算技术，推动规模达 10 万亿美元的医疗健康与

发表于 01-14 13:39 •162次阅读

NVIDIA助力西门子医疗加速医学影像AI部署

MONAI 集成现已上线西门子医疗 Digital Marketplace，加速 AI 在临床工作流中的应用落地。

发表于 12-06 11:51 •469次阅读

NVIDIA加速计算如何推动医疗健康

近日，NVIDIA 企业平台副总裁 Bob Pette 在 AI Summit 一场演讲中重点谈论了 NVIDIA 加速计算如何推动医疗健康

发表于 11-20 09:10 •421次阅读

AI for Science：人工智能驱动科学创新》第4章-AI与生命科学读后感

高效地筛选出具有潜力的药物候选分子，加速新药上市的进程。在基因测序与编辑领域，AI技术将提高基因数据的处理速度和准确性，为个性化医疗和精准

发表于 10-14 09:21

GE医疗与亚马逊云科技达成战略合作，通过生成式AI加速医疗健康领域转型

GE医疗已选择亚马逊云科技作为其战略云服务合作伙伴，致力于推出全新的定制化基础模型，加速创新医疗应用快速开发。 GE医疗将利用亚马逊云科

发表于 08-29 16:38 •328次阅读

云天励飞加速推动大模型行业落地

陈宁博士受邀发表主题演讲，首次展示云天励飞边缘AI的战略全貌。大模型落地的多重挑战边缘AI提供解法今年WAIC上，“大模型+行业”的应用

发表于 07-08 17:16 •718次阅读

西门子中国与亚马逊云科技签署战略合作协议加速生成式AI在制造行业创新应用落地

和服务，并结合西门子在工业领域的深厚积累和经验，联合创新团队将深入探索云计算、人工智能、机器学习、大数据等前沿技术与制造业更进一步融合，并加速生成式

发表于 04-18 11:30 •260次阅读

NVIDIA的专用AI平台如何推动下一代医疗健康行业的发展

医疗科技创新企业在 GTC 上介绍了 NVIDIA 的专用 AI 平台如何推动下一代医疗健康行业

发表于 04-09 10:10 •1397次阅读

NVIDIA在加速识因智能AI大模型落地应用方面的重要作用介绍

本案例介绍了 NVIDIA 在加速识因智能 AI 大模型落地应用方面的重要作用。生成式大模型已广泛应用于各领域，通过学习人类思维方式，能快速

发表于 03-29 15:28 •763次阅读

FPGA在深度学习应用中或将取代GPU

业可行性方面考虑，自动驾驶汽车等应用可能需要多达 7-10 个 GPU（其中大多数会在不到四年的时间内失效），对于大多数购车者来说，智能或自动驾驶汽车的成本将变得不切实际。” 机器人、医疗保健和安全

发表于 03-21 15:19

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

“联邦学习”或将推动AI在医疗行业加速落地？

医疗影像面临的数据挑战

“联邦学习”——打破数据壁垒，保护隐私数据

“联邦学习”VS.“集中化数据处理”

崛起的医疗AI，进击的NVIDIA

评论

FPGA+AI王炸组合如何重塑未来世界：看看DeepSeek东方神秘力量如何预测......

DeepSeek一体机:加速AI训推超融合,推动行业智能化落地

NVIDIA携手行业巨头，共促医疗健康产业变革

浅谈AI数据标注对智慧医疗的推动作用

NVIDIA携手多家机构推动医疗健康产业变革

NVIDIA 携手行业领先机构推动基因组学、药物发现及医疗健康行业发展

NVIDIA助力西门子医疗加速医学影像AI部署

NVIDIA加速计算如何推动医疗健康

AI for Science：人工智能驱动科学创新》第4章-AI与生命科学读后感

GE医疗与亚马逊云科技达成战略合作，通过生成式AI加速医疗健康领域转型

云天励飞加速推动大模型行业落地

西门子中国与亚马逊云科技签署战略合作协议加速生成式AI在制造行业创新应用落地

NVIDIA的专用AI平台如何推动下一代医疗健康行业的发展

NVIDIA在加速识因智能AI大模型落地应用方面的重要作用介绍

FPGA在深度学习应用中或将取代GPU