数据集概述
本数据集包含印度尼西亚东加里曼丹省阿卜杜勒·瓦哈卜·斯哈兰尼医院一百七十名结直肠癌患者的去标识化临床与组织病理学数据,涵盖人口统计学、生物标志物、肿瘤亚型、分期及三维测量等信息,填补了东南亚人群在全球数据库中的代表性空白。
文件详解
- 文件名称: clinical_records.csv:主临床数据文件,包含患者的人口统计学、CEA水平、肿瘤分期等九项临床参数与五项组织病理学参数。
- 文件名称: Data dictionary.pdf:PDF格式的数据字典,用于解释数据集各参数的定义与编码规则。
- 文件名称: Python scripts for analysis:用于数据分析的Python脚本文件,辅助使用者开展数据处理与建模工作。
数据来源
印度尼西亚阿卜杜勒·瓦哈卜·斯哈兰尼医院(RSUD Abdoel Wahab Sjahranie)
适用场景
- 生物标志物研究:验证东南亚人群结直肠癌生物标志物(如CEA)的临床价值。
- 机器学习应用:开发适用于东南亚人群的结直肠癌分期预测模型。
- 流行病学分析:探究印度尼西亚结直肠癌亚型(如髓样癌、印戒细胞癌)的分布特征与流行病学趋势。
- 临床特征研究:分析不同分期(TNM、Dukes)结直肠癌患者的临床参数差异。