数据集概述
本数据集源自美国国家癌症研究所(NCI)SEER项目2017年11月更新,包含2006-2010年确诊的浸润性导管和小叶癌女性患者数据。排除肿瘤大小等关键信息缺失及生存时间不足一个月的患者后,最终纳入4024例患者,记录其临床特征与生存情况。
文件详解
- SEER Breast Cancer Dataset.docx
- 文件格式:DOCX
- 字段映射介绍:文档类文件,推测包含数据集的详细说明、字段定义、数据收集方法及使用说明等内容
- SEER Breast Cancer Dataset.csv
- 文件格式:CSV
- 字段映射介绍:数据类文件,包含的主要字段有Age(年龄)、Race(种族)、Marital Status(婚姻状况)、T Stage(T分期)、N Stage(N分期)、6th Stage(第六版分期)、Grade(组织学分级)、A Stage(A分期)、Tumor Size(肿瘤大小)、Estrogen Status(雌激素状态)、Progesterone Status(孕激素状态)、Regional Node Examined(检查的区域淋巴结数)、Reginol Node Positive(阳性区域淋巴结数)、Survival Months(生存月数)、Status(状态)
数据来源
美国国家癌症研究所(NCI)SEER项目2017年11月更新数据,由JING TENG上传至IEEE Dataport
适用场景
- 乳腺癌临床特征分析: 研究患者年龄、种族、婚姻状况等人口学特征与乳腺癌临床分期、分级的关联
- 乳腺癌预后因素研究: 分析肿瘤大小、激素受体状态、淋巴结转移情况等对患者生存时间的影响
- 癌症数据科学建模: 为AI算法开发提供标准化临床数据,支持乳腺癌风险预测、生存分析等模型构建
- 公共卫生政策制定: 为乳腺癌筛查、治疗方案优化及资源分配提供数据支持
- 医学教育与培训: 作为临床数据案例,用于医学学生及研究人员的数据分析技能训练