使用机器学习创建计算机生成的X射线影像以增强AI的训练集-电子发烧友网

AI 特别是深度学习在提升医疗诊断的速度和准确率上拥有相当的潜力，但在临床医师可以驾驭 AI 的能力识别医学图像（例如 X 射线影像）中反映的疾病之前，他们需要先对模型进行大量训练，而罕见疾病标记图像的匮乏一直是深度学习医疗的一大障碍。现在，多伦多大学教授 Shahrokh Valaee 和他的团队设计了一种 AI 医疗领域中的新方法：使用生成对抗网络创建的 X 射线影像来增强 AI 训练集。实验表明，通过数据增强，无论对常见疾病还是罕见疾病，系统的识别准确率都有大幅提高。

Shahrokh Valaee 教授和博士生 Hojjat Salehinejad 正在使用机器学习创建虚拟 X 射线胸透影像来训练 AI 系统识别罕见疾病。摄影：Jess MacInnis

由于以监督学习方式训练 AI 系统的医学图像非常稀少，识别医学图像中的罕见疾病对于研究者而言一直是很有挑战的问题。

Shahrokh Valaee 教授和他的团队设计了一种新方法：使用机器学习创建计算机生成的 X 射线影像以增强 AI 的训练集。

在每个象限的左侧是一张真实的病人 X 射线胸透影像，其旁边是由 DCGAN 生成的合成 X 射线影像。在 X 射线影像的下方是对应的热图，是机器学习系统观察影像后得到的。图源：Hojjat Salehinejad/MIMLab

「在某种意义上，我们在使用机器学习来做机器学习，」多伦多大学 Edward S. Rogers 高级电气与计算机工程系（ECE）教授 Valaee 说。「我们正在创建模拟的但反映了特定罕见疾病的 X 射线影像，从而我们可以将它们和真实 X 射线影像结合起来，以得到足够规模的数据库，来训练神经网络在其它 X 射线影像上识别这些疾病。」

Valaee 是医学实验室机器智能（MIMLab）的成员，MIMLab 是一个由医师、科学家和工程研究员组成的团队，致力于将他们的专业知识结合到图像处理、人工智能和医学中以解决医学挑战。「AI 在医疗领域中有无数种方式能提供帮助，」Valaee 说，「为此我们需要大量数据。但对于某些罕见疾病，并没有让这些系统正常工作而必要的数千张标记图像。」

为了创建这些人工 X 射线影像，该团队使用了称为深度卷积生成对抗网络（DCGAN）的 AI 技术，来生成和不断提升模拟图像。GAN 是一类由两个网络构成的算法：一个网络生成图像，另一个尝试将合成图像和真实图像区分开来（判别器）。这两个网络被持续训练直到判别器无法将合成图像和真实图像区分。一旦创建了足够多的人工 X 射线影像，它们就和真实 X 射线影像结合起来以训练一个深度卷积神经网络（即分类器），然后该分类器用于对其它图像进行诊断（正常或有疾病）。

「我们的实验表明，由 DCGAN 生成的人工数据可以用于增强真实数据集，」Valaee 说。「这为我们提供了更多的训练数据，并提升了这些系统在识别罕见疾病上的性能。」

MIMLab 将用增强数据集获得的识别准确率和原始数据集获得的准确率进行对比，发现对于常见疾病，其识别准确率提高了 20%。对于某些罕见疾病，准确率提高了约 40%，并且由于合成的 X 射线影像不是源于真实的个体，该数据集可以轻易地提供给医院外的研究者，而不会侵犯个人隐私。

「这实在令人激动，通过证实这些增强数据集帮助提高了分类准确率，我们已经可以克服将人工智能应用到医疗中的一大障碍，」Valaee 说。「深度学习仅当训练数据足够多的时候才有效，而数据增强是可以确保神经网络能以高精度分类图像的一种方式。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器学习

机器学习

+关注

关注
66

文章
8478

浏览量
133805
数据集

数据集

+关注

关注
4

文章
1220

浏览量
25183
深度学习

深度学习

+关注

关注
73

文章
5544

浏览量
122275

原文标题：业界 | AI医疗新突破：增强罕见疾病的影像数据集，大幅提高识别准确率

文章出处：【微信号：tyutcsplab，微信公众号：智能感知与物联网技术研究所】欢迎添加关注！文章转载请注明出处。

计算机视觉/深度学习领域常用数据集汇总

、定位、检测等研究工作大多基于此数据集展开。Imagenet数据集文档详细，有专门的团队维护，使用非常方便，在计算机视觉领域研究论文中应用非常广，几乎成为了目前深度学习图像领域算法性能

发表于 08-29 10:36

CV之YOLO：深度学习之计算机视觉神经网络tiny-yolo-5clessses训练自己的数据集全程记录

CV之YOLO：深度学习之计算机视觉神经网络tiny-yolo-5clessses训练自己的数据集全程记录

发表于 12-24 11:50

CV之YOLOv3：深度学习之计算机视觉神经网络Yolov3-5clessses训练自己的数据集全程记录

CV之YOLOv3：深度学习之计算机视觉神经网络Yolov3-5clessses训练自己的数据集全程记录

发表于 12-24 11:51

用于计算机视觉训练的图像数据集介绍

用于计算机视觉训练的图像数据集

发表于 02-26 07:35

什么是计算机X线摄影

计算机X线摄影ComputedRadiography，CR,计算机X线摄影,传统的X线成像是经X

发表于 09-01 06:32

什么是机器学习? 机器学习基础入门

另一方面，机器学习是向计算机提供一组输入和输出，并要求计算机识别“算法”(或用机器学习的说法称为

发表于 06-21 11:06

机器学习在计算机免疫中的应用

机器学习研究的是通过经验自动改进的计算机算法。本文提出对 FICSEM 的一种改进方法：FICSEM2。FICSEM 是一种单例学习方法。适合大数据

发表于 09-01 15:59 •8次下载

新突破！超级计算机上深度学习训练时间缩减到数分钟

微软和瑞士国家计算中心（CSCS）的科学家们取得了重大突破，将超级计算机上深度学习的训练时间缩减到数分钟。训练时间的缩短，再加上超级

发表于 05-11 12:55 •2710次阅读

使用计算机视觉和人工智能来识别X射线中的计算机模型

这些模型使用计算机视觉和人工智能（AI）分析胸部X射线图像。它可以对肉眼通常无法识别的信息进行分类，并有助于诊断。

发表于 05-29 11:07 •1052次阅读

使用计算机视觉和人工智能来识别X射线中的病毒

　克兰菲尔德大学的学生设计了可以识别X射线中的计算机模型。

发表于 05-31 10:28 •765次阅读

AI能在单台计算机训练深度强化学习对处理尤为苛刻

训练最新 AI 系统需要惊人的计算资源，这意味着囊中羞涩的学术界实验室很难赶上富有的科技公司。但一种新的方法可以让科学家在单台计算机上训练先

发表于 07-29 09:45 •730次阅读

用于计算机视觉训练的图像数据集

角度的不同的摄像机查看图像或来自医疗扫描仪的多维数据。用于计算机视觉训练的图像数据集 Labelme：麻省理工学院计算机科学与人工智能实验室（CSAIL）

发表于 12-31 09:33 •2493次阅读

你需要知道的11个Torchvision计算机视觉数据集

计算机视觉是一个显著增长的领域，有许多实际应用，从自动驾驶汽车到面部识别系统。该领域的主要挑战之一是获得高质量的数据集来训练机器学习模型。

发表于 04-10 16:31 •904次阅读

什么是生成式AI？生成式AI的四大优势

生成式AI是一种特定类型的AI，专注于生成新内容，如文本、图像和音乐。这些系统在大型数据集上进行训练

发表于 05-29 14:12 •4759次阅读

计算机快速全息生成技术研究

快速全息生成技术依赖于计算机生成的全息影像（CGH）的快速创建。目前，基于光线追踪的计算机

发表于 12-12 11:15 •698次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

使用机器学习创建计算机生成的X射线影像以增强AI的训练集

评论

计算机视觉/深度学习领域常用数据集汇总

CV之YOLO：深度学习之计算机视觉神经网络tiny-yolo-5clessses训练自己的数据集全程记录

CV之YOLOv3：深度学习之计算机视觉神经网络Yolov3-5clessses训练自己的数据集全程记录

用于计算机视觉训练的图像数据集介绍

什么是计算机X线摄影

什么是机器学习? 机器学习基础入门

机器学习在计算机免疫中的应用

新突破！超级计算机上深度学习训练时间缩减到数分钟

使用计算机视觉和人工智能来识别X射线中的计算机模型

使用计算机视觉和人工智能来识别X射线中的病毒

AI能在单台计算机训练深度强化学习对处理尤为苛刻

用于计算机视觉训练的图像数据集

你需要知道的11个Torchvision计算机视觉数据集

什么是生成式AI？生成式AI的四大优势

计算机快速全息生成技术研究