数据集概述
该数据集包含八百二十七份来自不同患者的12导联心电图(ECG)记录,由心脏科医生、住院医师及医学生进行注释,涵盖六种心电图异常类型,是论文《基于深度神经网络的12导联心电图自动诊断》的测试集。
文件详解
- 文件名称:ecg_tracings.hdf5
- 文件格式:HDF5
- 内容说明:存储827条心电图记录,数据结构为(827,4096,12)的张量,维度分别对应患者数量、4096个信号样本、12个导联(顺序为DI、DII、DIII、AVR、AVL、AVF、V1-V6);信号采样率400Hz,以1e-4V为单位,需乘以1000转换为V;不足4096样本的信号两端补零
- 文件名称:attributes.csv
- 文件格式:CSV
- 内容说明:包含827条记录,对应ECG记录的患者性别(M/F)和年龄信息
- 文件夹名称:annotations/
- 文件夹内容:包含多个CSV格式注释文件,每条记录对应ECG记录,含6个异常字段(1dAVb、RBBB、LBBB、SB、AF、ST),值为1表示检测到异常,0表示未检测到
- cardiologist[1,2].csv:两位心脏科医生的注释
- gold_standard.csv:黄金标准注释(基于两位心脏科医生共识或第三位专家裁决)
- dnn.csv:论文中深度神经网络的预测结果
- cardiology_residents.csv:两位四年级心脏科住院医师的注释
- emergency_residents.csv:两位三年级急诊科住院医师的注释
- medical_students.csv:两位五年级医学生的注释
适用场景
- 医学人工智能研究:用于训练和验证心电图自动诊断模型
- 临床诊断对比分析:比较不同专业人员与AI模型的心电图异常识别结果
- 医学教育研究:评估不同阶段医学生的心电图判读能力
- 心血管疾病辅助诊断:探索深度学习在12导联心电图异常检测中的应用价值