第一波 FDA 批准的可穿戴数字健康监测器与智能手表等消费产品相结合,才刚刚面世。医疗传感器技术继续快速发展,使紧凑、经济且越来越精确的生理传感器能够进入现成的可穿戴设备。这种转变的真正驱动因素之一是尖端机器学习和人工智能算法的可用性,这些算法可以从大量数据中提取和解释有意义的信息。这包括噪声数据和不太完美的信号(例如来自智能手表的 ECG 数据),这些信号被各种难以使用往往是确定性和基于规则的传统算法处理的伪影破坏。
直到最近,解开来自这些传感器的生理信号中的秘密以形成可接受的监管提交的合理准确的决策是具有挑战性的,而且通常是不可能的。机器学习和人工智能算法的进步现在使工程师和科学家能够克服许多这些挑战。在本文中,我们将仔细研究用于处理生理信号的算法的整体架构,并揭开其操作的神秘面纱,将其转变为经过数十年研究建立的更真实的工程。
为了说明简单的机器学习算法的强大功能,这里有一个在线视频,描述了来自活动跟踪器中的加速度计的数据如何预测佩戴者的各种运动或休息状态。我们可以将这种方法扩展到更复杂的现实世界医学信号,例如心电图,并开发可以自动将心电图信号分类为正常或表现出心房颤动的算法。
开发机器学习算法包括两个主要步骤(图 1)。此工作流程的第一步是特征工程,其中从感兴趣的数据集中提取某些数值/数学特征并将其呈现给后续步骤。第二步,将提取的特征输入众所周知的统计分类或回归算法,例如支持向量机或适当配置的传统神经网络,以提出可用于新数据的训练模型设置为预测。一旦使用具有良好代表性的标记数据集对该模型进行迭代训练,直到达到令人满意的准确性,它就可以在新的数据集上用作生产环境中的预测引擎。
图 1. 包含训练和测试阶段的典型机器学习工作流程。
那么这个工作流程如何寻找心电图信号分类问题呢?在本案例研究中,我们转向2017 PhysioNet Challenge数据集,该数据集使用真实世界的单导联心电图数据。目的是将患者的 ECG 信号分类为以下四个类别之一:正常、心房颤动、其他节律和太嘈杂。在 MATLAB 中解决此问题的总体过程和各个步骤如图 2 所示。
图 2. 用于开发机器学习算法以对 ECG 信号进行分类的 MATLAB 工作流程。
预处理和特征工程
特征工程步骤可能是开发强大的机器学习算法中最难的部分。这样的问题不能简单地被视为“数据科学”问题,因为在探索解决这个问题的各种方法时,拥有生物医学工程领域的知识来理解不同类型的生理信号和数据非常重要。MATLAB 等工具将数据分析和高级机器学习功能带给领域专家,使他们能够更轻松地将高级机器学习等“数据科学”功能应用于他们正在解决的问题,从而专注于特征工程。在这个例子中,
开发分类模型
Statistics and Machine Learning Toolbox 中的分类学习器应用程序对于刚接触机器学习的工程师和科学家来说是一个特别有效的起点。在我们的示例中,一旦从信号中提取了足够数量的有用且相关的特征,我们就会使用这个应用程序来快速探索各种分类器及其性能,并缩小我们进一步优化的选项。这些分类器包括决策树、随机森林、支持向量机和 K 近邻 (KNN)。这些分类算法使您能够尝试各种策略并选择为您的特征集提供最佳分类性能的策略(通常使用混淆矩阵或 ROC 曲线下面积等指标进行评估)。在我们的案例中,我们很快就在所有类别中达到了约 80% 的总体准确率,只需遵循这种方法(本次比赛的获胜作品得分约为 83%)。请注意,我们没有花太多时间在特征工程或分类器调整上,因为我们的重点是验证方法。通常,花一些时间在特征工程和分类器调整上会导致分类准确性的显着进一步提高。更高级的技术(如深度学习)也可以应用于特征工程和提取以及分类步骤结合在一个训练步骤中的问题,尽管与传统方法相比,这种方法通常需要更大的训练数据集才能正常工作机器学习技术。只需遵循这种方法(本次比赛的获胜作品得分约为 83%)。请注意,我们没有花太多时间在特征工程或分类器调整上,因为我们的重点是验证方法。通常,花一些时间在特征工程和分类器调整上会导致分类准确性的显着进一步提高。更高级的技术(如深度学习)也可以应用于特征工程和提取以及分类步骤结合在一个训练步骤中的问题,尽管与传统方法相比,这种方法通常需要更大的训练数据集才能正常工作机器学习技术。只需遵循这种方法(本次比赛的获胜作品得分约为 83%)。请注意,我们没有花太多时间在特征工程或分类器调整上,因为我们的重点是验证方法。通常,花一些时间在特征工程和分类器调整上会导致分类准确性的显着进一步提高。更高级的技术(如深度学习)也可以应用于特征工程和提取以及分类步骤结合在一个训练步骤中的问题,尽管与传统方法相比,这种方法通常需要更大的训练数据集才能正常工作机器学习技术。因为我们的重点是验证该方法。通常,花一些时间在特征工程和分类器调整上会导致分类准确性的显着进一步提高。更高级的技术(如深度学习)也可以应用于特征工程和提取以及分类步骤结合在一个训练步骤中的问题,尽管与传统方法相比,这种方法通常需要更大的训练数据集才能正常工作机器学习技术。因为我们的重点是验证该方法。通常,花一些时间在特征工程和分类器调整上会导致分类准确性的显着进一步提高。更高级的技术(如深度学习)也可以应用于特征工程和提取以及分类步骤结合在一个训练步骤中的问题,尽管与传统方法相比,这种方法通常需要更大的训练数据集才能正常工作机器学习技术。
挑战、法规和未来承诺
虽然许多常见的可穿戴设备还没有完全准备好取代 FDA 批准和医学验证的同类设备,但所有技术和消费趋势都强烈指向这个方向。FDA 开始在简化法规和鼓励监管科学的发展方面发挥积极作用,特别是通过数字健康软件预认证计划以及设备开发中的建模和模拟等举措。
从日常使用的可穿戴设备收集的人体生理信号成为新的数字生物标志物,可以提供我们健康的全面图片,这一愿景现在比以往任何时候都更加真实,这在很大程度上归功于信号处理、机器学习和深度学习的进步算法。MATLAB 等工具支持的工作流程使医疗设备领域的专家能够应用和利用机器学习等数据科学技术,而无需成为数据科学专家。
审核编辑:郭婷
-
机器学习
+关注
关注
66文章
8357浏览量
132336 -
可穿戴设备
+关注
关注
55文章
3803浏览量
166804 -
深度学习
+关注
关注
73文章
5473浏览量
120913
发布评论请先 登录
相关推荐
评论