数据集概述
本数据集为Williams, Oliphant & Au等2024年研究使用的癌症处理数据,整合了TCGA、PCAWG、METABRIC和Nik-Zainal et al.来源的数据,将全基因组拷贝数变异信息处理为0.5Mb分箱格式,为癌症基因组学研究提供标准化的拷贝数分析基础数据。
文件详解
- 文件名称:cancer_data.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含经处理的癌症数据,核心内容为全基因组范围内以0.5Mb为分箱单位的拷贝数变异信息,整合自TCGA、PCAWG、METABRIC和Nik-Zainal et al.四个来源的原始数据。
数据来源
Williams, Oliphant & Au et al. 2024研究(整合TCGA、PCAWG、METABRIC和Nik-Zainal et al.来源数据)
适用场景
- 癌症基因组拷贝数变异分析:基于0.5Mb分箱数据研究全基因组拷贝数变异模式与癌症亚型的关联。
- 多来源癌症数据整合研究:对比不同数据库(TCGA、PCAWG等)处理后的数据一致性与差异。
- 癌症生物标志物挖掘:探索拷贝数变异区域作为癌症诊断、预后生物标志物的潜力。
- 肿瘤发生机制研究:分析全基因组拷贝数变化在肿瘤发生发展中的作用机制。