从MIT-BIH到PhysioNet-2021：手把手教你用Python和TensorFlow搭建你的第一个ECG分类模型（附完整代码）-港品优选

从MIT-BIH到PhysioNet-2021：手把手教你用Python和TensorFlow搭建你的第一个ECG分类模型（附完整代码）

在医疗健康领域，心电图（ECG）分析一直是人工智能技术落地的重要场景之一。想象一下，你刚学完Python基础语法，对机器学习充满好奇，周末想尝试一个既酷炫又有实际意义的项目——用AI识别心电图异常。本文将带你从零开始，用TensorFlow构建一个能自动分类心电信号的模型，体验从数据加载到模型部署的全流程。

不同于图像或文本数据，ECG信号具有独特的时序特性和医学背景知识。我们将选择PhysioNet-2017这类结构清晰的数据集作为起点，避开复杂的临床验证环节，专注于工程实现的核心步骤。即使你没有任何医学背景，也能在几小时内跑通整个流程，获得"我居然能用AI分析心电图"的成就感。

1. 环境准备与数据集选择

1.1 开发环境配置

推荐使用Python 3.8+环境，主要依赖库包括：

pip install tensorflow==2.10.0 pip install wfdb # 用于读取PhysioNet数据 pip install matplotlib pip install scikit-learn

对于硬件配置，即使没有独立GPU也能完成本教程，但使用GPU可以显著加速训练过程。以下是不同硬件下的预期训练时间对比：

硬件配置	100个epoch训练时间	备注
CPU (i7-11800H)	~45分钟	适合小批量数据
GPU (RTX 3060)	~8分钟	推荐配置
Google Colab免费版	~15分钟	需注意运行时长限制

1.2 ECG数据集对比与选择

初学者常陷入数据集选择的困境。以下是主流ECG数据集的特性对比：

数据集	记录数	导联数	采样率	主要特点
MIT-BIH	48	2	360Hz	经典但规模小
PhysioNet-2017	8528	1	300Hz	单导联，类别清晰
PTB-XL	21,837	12	500Hz	临床标注丰富
PhysioNet-2021	88,000+	12	多种	多中心数据

对于首个项目，建议选择PhysioNet-2017数据集，原因有三：

单导联数据更易处理
四分类任务（正常、房颤、噪声、其他）适合入门
数据质量相对一致，预处理简单

2. ECG数据加载与可视化

2.1 从PhysioNet下载数据

使用WFDB库可直接获取数据：

import wfdb # 下载第一条记录作为示例 record = wfdb.rdrecord('p00001', pn_dir='physionet.org/files/challenge-2017/1.0.0') wfdb.plot_wfdb(record=record, title='ECG示例')

这段代码会显示类似下图的波形：

[图示：正常ECG波形，标注P波、QRS波群、T波]

2.2 数据解析与特征观察

ECG信号包含几个关键特征点：

P波：心房去极化，正常宽度<120ms
QRS波群：心室去极化，典型宽度80-120ms
T波：心室复极化
RR间期：相邻QRS波的时间差，反映心率变异性

查看数据的基本统计信息：

print(f"采样率：{record.fs}Hz") print(f"信号长度：{len(record.p_signal)}个采样点") print(f"导联名称：{record.sig_name}")

典型输出：

采样率：300Hz 信号长度：3000个采样点 导联名称：['MLII']

3. 数据预处理流水线

3.1 信号滤波与归一化

原始ECG常包含基线漂移和工频干扰，需进行预处理：

from scipy import signal def preprocess_ecg(ecg_signal, fs=300): # 去除基线漂移 (0.5-1Hz高通) b, a = signal.butter(3, [0.5, 40], btype='bandpass', fs=fs) filtered = signal.filtfilt(b, a, ecg_signal) # 归一化到[-1,1]范围 normalized = (filtered - np.min(filtered)) / (np.max(filtered) - np.min(filtered)) return normalized * 2 - 1

注意：滤波参数需根据具体采样率调整。对于300Hz数据，40Hz低通可有效去除肌电噪声。

3.2 数据增强策略

ECG数据增强的常用方法：

时间扭曲：轻微拉伸或压缩时间轴
幅度缩放：随机调整信号幅度
添加噪声：模拟真实采集环境
片段裁剪：随机选取信号片段

实现时间扭曲的示例代码：

def time_warp(signal, factor=0.1): length = signal.shape[0] warp_points = int(length * factor) random_points = np.sort(np.random.randint(0, length, warp_points)) return np.interp(np.arange(length), random_points, signal[random_points])

4. 构建CNN-LSTM混合模型

4.1 模型架构设计

结合CNN的局部特征提取和LSTM的时序建模能力：

from tensorflow.keras.models import Sequential from tensorflow.keras.layers import * def build_model(input_shape=(3000,1), num_classes=4): model = Sequential([ Conv1D(64, 15, activation='relu', input_shape=input_shape), MaxPooling1D(2), Conv1D(128, 10, activation='relu'), MaxPooling1D(2), LSTM(64, return_sequences=True), LSTM(32), Dense(100, activation='relu'), Dropout(0.3), Dense(num_classes, activation='softmax') ]) model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy']) return model

模型结构可视化：

输入层(3000,1) ↓ Conv1D(64, kernel_size=15) → 提取局部波形特征 ↓ MaxPooling1D(2) → 降采样 ↓ Conv1D(128, kernel_size=10) → 更高层次特征 ↓ LSTM(64) → 捕捉时序依赖 ↓ LSTM(32) → 时序特征精炼 ↓ 全连接层 → 分类决策

4.2 模型训练技巧

ECG分类特有的训练策略：

类别权重平衡：处理不平衡数据
动态学习率：训练后期微调参数
早停机制：防止过拟合

设置类别权重的示例：

from sklearn.utils.class_weight import compute_class_weight class_weights = compute_class_weight('balanced', classes=np.unique(y_train), y=y_train) class_weight_dict = dict(enumerate(class_weights))

5. 模型评估与结果解读

5.1 性能指标选择

不同于一般分类任务，ECG评估需考虑：

指标	公式	医学意义
灵敏度	TP/(TP+FN)	避免漏诊危重病例
阳性预测值	TP/(TP+FP)	减少误诊
F1分数	2(PR)/(P+R)	综合平衡

混淆矩阵示例（模拟数据）：

真实\预测	正常	房颤	噪声	其他
正常	850	5	10	35
房颤	15	420	8	57
噪声	25	2	380	13
其他	30	40	20	410

5.2 结果可视化分析

绘制特征激活图，理解模型关注点：

import matplotlib.pyplot as plt def plot_activations(model, ecg_sample): layer_outputs = [layer.output for layer in model.layers[:4]] activation_model = Model(inputs=model.input, outputs=layer_outputs) activations = activation_model.predict(ecg_sample[np.newaxis,...]) plt.figure(figsize=(12,8)) for i, activation in enumerate(activations): plt.subplot(len(activations), 1, i+1) plt.plot(activation[0,:,0]) plt.title(f'Layer {i+1}激活')

典型输出会显示模型在不同层对QRS波群的响应逐渐增强。

6. 完整项目结构建议

规范的ECG项目目录应包含：

/ecg-classification │── /data # 原始数据 │── /processed # 预处理后数据 │── /models # 保存的模型 │── /utils # 工具函数 │ ├── preprocessing.py │ └── visualization.py │── config.yaml # 参数配置 │── train.py # 训练脚本 │── evaluate.py # 评估脚本 └── requirements.txt

关键配置文件示例（config.yaml）：

data: sampling_rate: 300 dataset: physionet2017 classes: [normal, af, noise, other] model: architecture: cnn_lstm input_length: 3000 conv_filters: [64, 128] lstm_units: [64, 32] training: batch_size: 32 epochs: 100 learning_rate: 0.001

在实际部署中发现，将信号长度统一为3000个采样点（对应PhysioNet-2017的10秒记录）能平衡信息保留和计算效率。对于更长的记录，建议采用滑动窗口分割策略。

企业官网建设流程全解析