血液学全血细胞计数数据集
数据来源:互联网公开数据
标签:血液学,全血细胞计数,CBC,疾病预测,机器学习,医学数据,临床诊断,数据挖掘,MIMIC-III,Streamlit应用
数据概述:
本数据集来源于MIMIC-III数据库,包含40,000多名2001年至2012年间在贝斯以色列女执事医疗中心重症监护病房接受治疗患者的去标识化健康数据。数据集专门用于推导血液学全血细胞计数(CBC)数据,涵盖了血红蛋白、嗜酸性粒细胞、淋巴细胞、单核细胞、嗜碱性粒细胞、中性粒细胞、红细胞和白细胞等关键指标,为疾病预测和临床诊断提供了丰富的数据基础。
数据用途概述:
该数据集适用于血液学研究、疾病预测模型开发、临床数据分析等多种场景。研究人员可以利用此数据进行机器学习模型训练,以预测患者的疾病状态;医疗机构可以借助数据优化诊断流程;教育机构可利用数据进行医学教育和培训。此外,数据集还支持通过Streamlit应用程序输入血液学参数进行疾病预测。
举例:
该数据集包含以下字段:
- Hemoglobin(血红蛋白)
- Eosinophils(嗜酸性粒细胞)
- Lymphocytes(淋巴细胞)
- Monocytes(单核细胞)
- Basophils(嗜碱性粒细胞)
- Neutrophils(中性粒细胞)
- Red Blood Cells(红细胞)
- White Blood Cells(白细胞)
通过这些参数,可以预测以下疾病:
- Anemia(贫血)
- Leukemia(白血病)
- Thrombocytopenia(血小板减少)
- Thrombocytosis(血小板增多)
- Normal(正常)
- Other(其他)
项目目标包括:
1. 从MIMIC-III数据集中推导血液学全血细胞计数(CBC)数据集。
2. 构建机器学习模型以至少达到0.8的准确率预测患者的疾病状态(当前已达到0.01的准确率,正在优化中)。
3. 开发Streamlit应用程序,输入血液学参数以预测患者的疾病状态。