糖尿病患者临床指标聚类分析数据集2022

数据集概述

该数据集基于糖尿病患者临床数据构建,原始包含七百二十九例患者及三十九项临床变量,经处理后保留十八项数值型指标。通过层次聚类与因子分析,实现患者和变量的相似性分组,旨在辅助评估患者健康状态及特定指标在分组中的作用,同时提供三维分类Python工具。

文件详解

  • 数据文件:
  • Data_diabet_set_729_3D_plot.csv: CSV格式,包含患者ID、姓名、LEU(白细胞)、HDL(高密度脂蛋白)、BMI(体重指数)、Cluster(聚类类别)、Cluster distance(聚类距离)等字段。
  • 可视化结果文件:
  • Data_20220608_result_plot_2D_projections_per_class.png: PNG格式,按类别划分的二维投影结果图。
  • Data_20220608_result_plot_3D_and_2D_projections.png: PNG格式,三维聚类及二维投影结果图。
  • 代码文件:
  • plot-3D-cluster_Data_20220608.py: Python代码文件,用于生成三维聚类可视化结果。

适用场景

  • 糖尿病临床研究: 分析患者临床指标与聚类分组的关联,评估健康状态。
  • 医学数据挖掘: 探索层次聚类、因子分析在临床变量分组中的应用效果。
  • 可视化工具开发: 参考三维分类Python工具的实现逻辑,构建医学数据可视化系统。
  • 生物标志物研究: 识别对患者聚类模式形成有显著作用的临床指标。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.35 MiB
最后更新 2025年12月23日
创建于 2025年12月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。