基于KerasConv1D心电图检测开源教程-电子发烧友网

本实战内容取自笔者参加的首届中国心电智能大赛项目，初赛要求为设计一个自动识别心电图波形算法。笔者使用Keras框架设计了基于Conv1D结构的模型，并且开源了代码作为Baseline。内容包括数据预处理，模型搭建，网络训练，模型应用等，此Baseline采用最简单的一维卷积达到了88%测试准确率。有多支队伍在笔者基线代码基础上调优取得了优异成绩，顺利进入复赛。

数据介绍

下载完整的训练集和测试集，共1000例常规心电图，其中训练集中包含600例，测试集中共400例。该数据是从多个公开数据集中获取。参赛团队需要利用有正常/异常两类标签的训练集数据设计和实现算法，并在没有标签的测试集上做出预测。

该心电数据的采样率为500 Hz。为了方便参赛团队用不同编程语言都能读取数据，所有心电数据的存储格式为MAT格式。该文件中存储了12个导联的电压信号。训练数据对应的标签存储在txt文件中，其中0代表正常，1代表异常。

赛题分析

简单分析一下，初赛的数据集共有1000个样本，其中训练集中包含600例，测试集中共400例。其中训练集中包含600例是具有label的，可以用于我们训练模型；测试集中共400例没有标签，需要我们使用训练好的模型进行预测。

赛题就是一个二分类预测问题，解题思路应该包括以下内容

数据读取与处理

网络模型搭建

模型的训练

模型应用与提交预测结果

实战应用

经过对赛题的分析，我们把任务分成四个小任务，首先第一步是：

1.数据读取与处理

我们由上述描述可以得知，

我们的数据保存在MAT格式文件中（这决定了后面我们要如何读取数据）

采样率为500 Hz（这个信息并没有怎么用到，大家可以简单了解一下，就是1秒采集500个点，由后面我们得知每个数据都是5000个点，也就是10秒的心电图片）

12个导联的电压信号（这个是指采用12种导联方式，大家可以简单理解为用12个体温计量体温，从而得到更加准确的信息，下图为导联方式简单介绍，大家了解下即可。要注意的是，既然提供了12种导联，我们应该全部都用到，虽然我们仅使用一种导联方式也可以进行训练与预测，但是经验告诉我们，采取多个特征会取得更优效果）

数据处理函数定义：

import kerasfrom scipy.io import loadmatimport matplotlib.pyplot as pltimport globimport numpy as npimport pandas as pdimport mathimport osfrom keras.layers import *from keras.models import *from keras.objectives import *BASE_DIR = “preliminary/TRAIN/”#进行归一化def normalize（v）： return （v - v.mean（axis=1）.reshape（（v.shape［0］，1））） / （v.max（axis=1）.reshape（（v.shape［0］，1）） + 2e-12）loadmat打开文件def get_feature（wav_file，Lens = 12，BASE_DIR=BASE_DIR）： mat = loadmat（BASE_DIR+wav_file） dat = mat［“data”］ feature = dat［0:12］ return（normalize（feature）.transopse（））#把标签转成oneHot形式def convert2oneHot（index，Lens）： hot = np.zeros（（Lens，）） hot［index］ = 1 return（hot）TXT_DIR = “preliminary/reference.txt”MANIFEST_DIR = “preliminary/reference.csv”

读取一条数据进行显示

if name__ == “__main”： dat1 = get_feature（“preliminary/TRAIN/TRAIN101.mat”） print（dat1.shape） #one data shape is （12， 5000） plt.plt（dat1［：，0］） plt.show（）

我们由上述信息可以看出每种导联都是由5000个点组成的列表，12种导联方式使每个样本都是12*5000的矩阵，类似于一张分辨率为12x5000的照片。

我们需要处理的就是把每个读取出来，归一化一下，送入网络进行训练可以了。

标签处理方式

def create_csv（TXT_DIR=TXT_DIR）： lists = pd.read_csv（TXT_DIR，sep=r“\t”，header=None） lists = lists.sample（frac=1） lists.to_csv（MANIFEST_DIR，index=None） print（“Finish save csv”）

我这里是采用从reference.txt读取，然后打乱保存到reference.csv中，注意一定要进行数据打乱操作，不然训练效果很差。因为原始数据前面便签全部是1，后面全部是0

数据迭代方式

Batch_size = 20def xs_gen（path=MANIFEST_DIR，batch_size = Batch_size，train=True）：img_list = pd.read_csv（path）if train ： img_list = np.array（img_list）［：500］ print（“Found %s train items.”%len（img_list）） print（“list 1 is”，img_list［0］） steps = math.ceil（len（img_list） / batch_size） # 确定每轮有多少个batchelse： img_list = np.array（img_list）［500：］ print（“Found %s test items.”%len（img_list）） print（“list 1 is”，img_list［0］） steps = math.ceil（len（img_list） / batch_size） # 确定每轮有多少个batchwhile True： for i in range（steps）： batch_list = img_list［i * batch_size ： i * batch_size + batch_size］ np.random.shuffle（batch_list） batch_x = np.array（［get_feature（file） for file in batch_list［：，0］］） batch_y = np.array（［convert2oneHot（label，2） for label in batch_list［：，1］］） yield batch_x， batch_y

数据读取的方式我采用的是生成器的方式，这样可以按batch读取，加快训练速度，大家也可以采用一下全部读取，看个人的习惯了

2.网络模型搭建

数据我们处理好了，后面就是模型的搭建了，我使用keras搭建的，操作简单便捷，tf，pytorch，sklearn大家可以按照自己喜好来。

网络模型可以选择CNN，RNN，Attention结构，或者多模型的融合，抛砖引玉，此Baseline采用的一维CNN方式，一维CNN学习地址

模型搭建

TIME_PERIODS = 5000num_sensors = 12def build_model（input_shape=（TIME_PERIODS，num_sensors），num_classes=2）： model = Sequential（） #model.add（Reshape（（TIME_PERIODS， num_sensors）， input_shape=input_shape）） model.add（Conv1D（16， 16，strides=2， activation=‘relu’，input_shape=input_shape）） model.add（Conv1D（16， 16，strides=2， activation=‘relu’，padding=“same”）） model.add（MaxPooling1D（2）） model.add（Conv1D（64， 8，strides=2， activation=‘relu’，padding=“same”）） model.add（Conv1D（64， 8，strides=2， activation=‘relu’，padding=“same”）） model.add（MaxPooling1D（2）） model.add（Conv1D（128， 4，strides=2， activation=‘relu’，padding=“same”）） model.add（Conv1D（128， 4，strides=2， activation=‘relu’，padding=“same”）） model.add（MaxPooling1D（2）） model.add（Conv1D（256， 2，strides=1， activation=‘relu’，padding=“same”）） model.add（Conv1D（256， 2，strides=1， activation=‘relu’，padding=“same”）） model.add（MaxPooling1D（2）） model.add（GlobalAveragePooling1D（）） model.add（Dropout（0.3）） model.add（Dense（num_classes， activation=‘softmax’）） return（model）

用model.summary（）输出的网络模型为

训练参数比较少，大家可以根据自己想法更改。

3.网络模型训练

模型训练

if name__ == “__main”： “”“dat1 = get_feature（”TRAIN101.mat“） print（”one data shape is“，dat1.shape） #one data shape is （12， 5000） plt.plot（dat1［0］） plt.show（）”“” if （os.path.exists（MANIFEST_DIR）==False）： create_csv（） train_iter = xs_gen（train=True） test_iter = xs_gen（train=False） model = build_model（） print（model.summary（）） ckpt = keras.callbacks.ModelCheckpoint（ filepath=‘best_model.{epoch:02d}-{val_acc：.2f}.h5’， monitor=‘val_acc’， save_best_only=True，verbose=1） model.compile（loss=‘categorical_crossentropy’， optimizer=‘adam’， metrics=［‘accuracy’］） model.fit_generator（ generator=train_iter， steps_per_epoch=500//Batch_size， epochs=20， initial_epoch=0， validation_data = test_iter， nb_val_samples = 100//Batch_size， callbacks=［ckpt］，）

训练过程输出（最优结果：loss： 0.0565 - acc： 0.9820 - val_loss： 0.8307 - val_acc： 0.8800）

Epoch 10/2025/25 ［==============================］ - 1s 37ms/step - loss： 0.2329 - acc： 0.9040 - val_loss： 0.4041 - val_acc： 0.8700Epoch 00010： val_acc improved from 0.85000 to 0.87000， saving model to best_model.10-0.87.h5Epoch 11/2025/25 ［==============================］ - 1s 38ms/step - loss： 0.1633 - acc： 0.9380 - val_loss： 0.5277 - val_acc： 0.8300Epoch 00011： val_acc did not improve from 0.87000Epoch 12/2025/25 ［==============================］ - 1s 40ms/step - loss： 0.1394 - acc： 0.9500 - val_loss： 0.4916 - val_acc： 0.7400Epoch 00012： val_acc did not improve from 0.87000Epoch 13/2025/25 ［==============================］ - 1s 38ms/step - loss： 0.1746 - acc： 0.9220 - val_loss： 0.5208 - val_acc： 0.8100Epoch 00013： val_acc did not improve from 0.87000Epoch 14/2025/25 ［==============================］ - 1s 38ms/step - loss： 0.1009 - acc： 0.9720 - val_loss： 0.5513 - val_acc： 0.8000Epoch 00014： val_acc did not improve from 0.87000Epoch 15/2025/25 ［==============================］ - 1s 38ms/step - loss： 0.0565 - acc： 0.9820 - val_loss： 0.8307 - val_acc： 0.8800Epoch 00015： val_acc improved from 0.87000 to 0.88000， saving model to best_model.15-0.88.h5Epoch 16/2025/25 ［==============================］ - 1s 38ms/step - loss： 0.0261 - acc： 0.9920 - val_loss： 0.6443 - val_acc： 0.8400Epoch 00016： val_acc did not improve from 0.88000Epoch 17/2025/25 ［==============================］ - 1s 38ms/step - loss： 0.0178 - acc： 0.9960 - val_loss： 0.7773 - val_acc： 0.8700Epoch 00017： val_acc did not improve from 0.88000Epoch 18/2025/25 ［==============================］ - 1s 38ms/step - loss： 0.0082 - acc： 0.9980 - val_loss： 0.8875 - val_acc： 0.8600Epoch 00018： val_acc did not improve from 0.88000Epoch 19/2025/25 ［==============================］ - 1s 37ms/step - loss： 0.0045 - acc： 1.0000 - val_loss： 1.0057 - val_acc： 0.8600Epoch 00019： val_acc did not improve from 0.88000Epoch 20/2025/25 ［==============================］ - 1s 37ms/step - loss： 0.0012 - acc： 1.0000 - val_loss： 1.1088 - val_acc： 0.8600Epoch 00020： val_acc did not improve from 0.88000

4.模型应用预测结果

预测数据

if name__ == “__main”： “”“dat1 = get_feature（”TRAIN101.mat“） print（”one data shape is“，dat1.shape） #one data shape is （12， 5000） plt.plot（dat1［0］） plt.show（）”“” “”“if （os.path.exists（MANIFEST_DIR）==False）： create_csv（） train_iter = xs_gen（train=True） test_iter = xs_gen（train=False） model = build_model（） print（model.summary（）） ckpt = keras.callbacks.ModelCheckpoint（ filepath=‘best_model.{epoch:02d}-{val_acc：.2f}.h5’， monitor=‘val_acc’， save_best_only=True，verbose=1） model.compile（loss=‘categorical_crossentropy’， optimizer=‘adam’， metrics=［‘accuracy’］） model.fit_generator（ generator=train_iter， steps_per_epoch=500//Batch_size， epochs=20， initial_epoch=0， validation_data = test_iter， nb_val_samples = 100//Batch_size， callbacks=［ckpt］，）”“” PRE_DIR = “sample_codes/answers.txt” model = load_model（“best_model.15-0.88.h5”） pre_lists = pd.read_csv（PRE_DIR，sep=r“ ”，header=None） print（pre_lists.head（）） pre_datas = np.array（［get_feature（item，BASE_DIR=“preliminary/TEST/”） for item in pre_lists［0］］） pre_result = model.predict_classes（pre_datas）#0-1概率预测 print（pre_result.shape） pre_lists［1］ = pre_result pre_lists.to_csv（“sample_codes/answers1.txt”，index=None，header=None） print（“predict finish”）

下面是前十条预测结果：

TEST394，0TEST313，1TEST484，0TEST288，0TEST261，1TEST310，0TEST286，1TEST367，1TEST149，1TEST160，1

展望

此Baseline采用最简单的一维卷积达到了88%测试准确率（可能会因为随机初始化值上下波动），大家也可以多尝试GRU，Attention，和Resnet等结果，测试准确率会突破90+。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

心电图

心电图

+关注

关注
1

文章
79

浏览量
25322
开源

开源

+关注

关注
3

文章
3302

浏览量
42458

原文标题：实战 | 基于KerasConv1D心电图检测开源教程（附代码）

文章出处：【微信号：rgznai100，微信公众号：rgznai100】欢迎添加关注！文章转载请注明出处。

ads1292r可以读出数据但画图不准确是什么原因导致的？

尝试了很多的配置但是画的图不像心电图 谁有数据可以参考一下吗

发表于 12-18 08:15

用ADS1198设计12导的心电检测仪遇到的信号采集问题求解

请教TI工程师,我正在使用ADS1198设计12导的心电检测仪,原理图根据sbau180.pdf设计,模拟电源和数字电源都是采用3.3V单电源供电,中间用磁珠联通.目前程序已经完成,用心电模拟仪

发表于 12-17 08:01

开发一个基于ADS1293的心电图机时遇到的疑问求解

您好，我在开发一个基于ADS1293的心电图机时遇到以下问题，希望能得到解答： 1. 当提高ODR过采样率时(比如400HZ)，所得到的波形干扰仍旧很大(如下I导联)，如何在保证高ODR采样率时，得到正确的波形？ 2. 这是我的ECG原始数据转电压计算公式，不知是否正确

发表于 11-28 06:13

使用MSP430FG439的心率和心电图监测器

电子发烧友网站提供《使用MSP430FG439的心率和心电图监测器.pdf》资料免费下载

发表于 10-22 09:30 •0次下载

使用MSP430FG439的心率和<b class='flag-5'>心电图</b>监测器

CBM24AD9X系列-高性能心电图及生物电势测量的理想选择

在现代医疗科技的飞速发展中，精确的生物电势测量设备变得越来越重要。芯佰微电子推出的CBM24AD9X系列，是一款专为心电图（ECG）和其他生物电势测量设计的低噪声24位模数转换器（ADC），为医疗

发表于 09-23 15:41 •318次阅读

CBM24AD9X系列-高性能<b class='flag-5'>心电图</b>及生物电势测量的理想选择

使用MSP430G2xx LaunchPad套件实现基于心电图的心率监测器

电子发烧友网站提供《使用MSP430G2xx LaunchPad套件实现基于心电图的心率监测器.pdf》资料免费下载

发表于 09-20 10:47 •0次下载

使用MSP430G2xx LaunchPad套件实现基于<b class='flag-5'>心电图</b>的心率监测器

可穿戴设备上的心电图信号采集应用简报

电子发烧友网站提供《可穿戴设备上的心电图信号采集应用简报.pdf》资料免费下载

发表于 09-10 09:19 •0次下载

可穿戴设备上的<b class='flag-5'>心电图</b>信号采集应用简报

国产化手持单导心电仪技术解决方案，助力血压计厂商实现房颤精准捕捉

患者风险，降低医疗负担非常有效。最近一年，欧姆龙在此方面动作频频，先后推出了两款基于心电图的房颤筛查产品，一款为独立的便携式心电仪，一款是将心电图功能集成在了血压计当中。苏州唯理作为国内心

发表于 08-05 11:15 •233次阅读

推荐一款好用的十二导联心电图机

十二导联心电图机是一种医疗设备，用于检测和记录心脏电活动的变化。由十二个电极组成的，这些电极可以通过皮肤接触到患者的胸部和四肢，实现对十二导联心电信号进行同步采集，通过对心电信号的工频

发表于 07-11 18:34

#参考设计#可穿戴心电图设计方案

可穿戴心电图参考设计可测量心率数据和运动，并实现物联网连接以实现健康管理。 *附件：可穿戴心电图参考设计.pdf 心电图 （ECG）心脏数据提供了心脏功能的详细信息，而不仅仅是简单的每分钟心跳

发表于 06-28 18:19 •8709次阅读

医疗手持终端PDA定制开发_医用心电图机方案

。4GB+64GB的大容量存储空间保证了数据的快速存储和检索，无需复杂的操作步骤，医护人员可以轻松进行心电图的测量和分析。

发表于 06-11 20:07 •499次阅读

利用深度循环神经网络对心电图降噪

使用Patrick E. McSharry, Gari D. Clifford, LionelTarassenko, and Leonard A. Smith，提出的\"生成合成心电图信号的动态

发表于 05-15 14:42

苹果智能戒指Apple Ring或即将发布，功能强大引期待

近日，苹果公司的一款全新智能戒指Apple Ring引发了广泛关注。据悉，这款可穿戴设备旨在跟踪用户的健康数据，功能多样，包括检测心电图和支持无线充电等。

发表于 02-25 11:35 •1347次阅读

苹果智能戒指再曝光或有心电图功能

苹果智能戒指再曝光或有心电图功能有爆料称苹果公司的智能戒指Apple Ring正在加速，据悉苹果智能戒指将能够用于控制智能手机和平板电脑。还具有内部传感器、NFC控制器以及测量心率、非接触式付款

发表于 02-22 18:15 •3019次阅读

Nordic Chiplet芯片级解决方案助力微型模块收集和传输心电图数据

致力于为AIoT市场提供Chiplet芯片级解决方案的勇芯科技(Bravechip)推出了微型模块BCL601S1，用于提供心电图(ECG)读数的医疗设备。

发表于 12-22 14:01 •774次阅读

搜索历史

基于KerasConv1D心电图检测开源教程

评论

ads1292r可以读出数据但画图不准确是什么原因导致的？

用ADS1198设计12导的心电检测仪遇到的信号采集问题求解

开发一个基于ADS1293的心电图机时遇到的疑问求解

使用MSP430FG439的心率和心电图监测器

CBM24AD9X系列-高性能心电图及生物电势测量的理想选择

使用MSP430G2xx LaunchPad套件实现基于心电图的心率监测器

可穿戴设备上的心电图信号采集应用简报

国产化手持单导心电仪技术解决方案，助力血压计厂商实现房颤精准捕捉

推荐一款好用的十二导联心电图机

#参考设计#可穿戴心电图设计方案

医疗手持终端PDA定制开发_医用心电图机方案

利用深度循环神经网络对心电图降噪

苹果智能戒指Apple Ring或即将发布，功能强大引期待

苹果智能戒指再曝光或有心电图功能

Nordic Chiplet芯片级解决方案助力微型模块收集和传输心电图数据