食管癌术前新辅助化疗放疗后的病理完全缓解预测数据集-2015-lijsbeth
数据来源:互联网公开数据
标签:食管癌,化疗放疗,病理缓解,预测模型,肿瘤分期,数据清理,医学研究,临床决策
数据概述:
本数据集包含了2015年一项研究中收集的食管癌患者术前新辅助化疗放疗后的病理完全缓解预测数据。数据集来源于Toxopeus等人在《Radiotherapy and Oncology》期刊上发表的论文,用于构建预测病理完全缓解的计算模型。数据集包含20,000个患者记录,每个记录包含以下字段:
- Patient ID:患者唯一标识符(UUID)
- Patient age:患者年龄(整数),基于原文中给出的均值和范围
- Patient sex:患者性别(二元变量),基于原文中给出的数据分布
- Tumor type:肿瘤类型(分类变量),基于原文中给出的数据分布
- Differentiation grade:分化程度(有序变量),基于原文中给出的数据分布
- T-stage:T分期(有序变量),基于原文中给出的数据分布
- N-stage:N分期(有序变量),基于原文中给出的数据分布
- M-stage:M分期(有序变量),基于原文中给出的数据分布
- Overall stage:总体分期(有序变量),基于TNM分期系统
- Survival time:生存时间(浮点数),基于Kaplan-Meier生存曲线
数据集还包含一个目标变量:
- Treatment response:治疗反应,基于Halilaj等人在《Biomedicines》期刊上发表的计算预测模型
数据集中涉及的肿瘤分期及分化程度定义如下:
- T分期:0-未发现,1-4-肿瘤大小和扩展程度,X-无法测量
- N分期:0-未发现,1-3-受影响的淋巴结数量,X-无法测量
- M分期:0-未转移,1-已转移,X-无法测量
- 分化程度:1-4从良好分化到未分化,X-无法测量
数据集中存在一些数据质量问题,包括记录重复、ID重复、缺失值引入、非现实值引入(如负年龄)、异常值引入、拼写错误等。在使用数据时需要谨慎处理,确保数据质量,因为医疗数据中的每个数据点都至关重要。
数据用途概述:
该数据集适用于食管癌治疗效果预测、临床决策支持、医学研究等场景。研究人员可利用此数据集构建和验证预测模型;临床医生可基于预测结果制定个性化治疗方案;医学教育机构可用作教学示例,帮助学生理解癌症分期、治疗反应及其预测模型。对于医疗保健专业人员而言,该数据集是评估治疗效果和优化临床决策的重要资源。