数据集概述
本数据集包含60000例临床癌症样本的突变频率与拷贝数变异分析结果,支持研究肿瘤演化、患者预后及转移倾向性。核心内容为INCOMMON方法(用于检测等位基因特异性拷贝数变异)的分析脚本与结果,涉及PCAWG、TCGA等多源数据,共45个文件,涵盖代码、数据表格及补充文件。
文件详解
- 代码文件(.r)
- 文件名称:如3.1.evaluate_performance.R、7.2.plot_met_propensity.R、library.R
- 文件格式:R脚本
- 字段映射介绍:包含INCOMMON方法性能评估、转移倾向性分析等功能的分析脚本,共21个
- 数据文件(.rds、.tsv、.txt)
- 文件名称:如msk_cox_table_hotspots.rds、tcga_sample.tsv、dfci_classified_with_priors_time.txt
- 文件格式:R数据对象、制表符分隔文本、纯文本
- 字段映射介绍:涵盖临床队列(MSK、DFCI、TCGA)的COX回归表、分类结果、样本信息(如project_id、case_id、biospecimen_anatomic_site等),共18个
- 补充表格(.xlsx)
- 文件名称:S1_PCAWG_Priors.xlsx、S2_INCOMMON_Class_Enrichment.xlsx、S6_Met_Tropism.xlsx
- 文件格式:Excel表格
- 字段映射介绍:包含PCAWG先验信息、INCOMMON分类富集结果、转移倾向性分析等补充数据,共6个
数据来源
INCOMMON方法相关研究(含PCAWG、TCGA、MSK-MetTropism、AACR GENIE-Dfci数据)
适用场景
- 癌症基因组学研究: 分析体细胞突变与拷贝数变异的相互作用对肿瘤演化的影响
- 癌症预后预测: 基于复合基因型分层结果,研究患者生存预后的相关因素
- 转移倾向性分析: 探究肿瘤转移倾向性及器官特异性转移的基因组学机制
- 计算方法验证: 评估INCOMMON方法在临床靶向测序数据中的性能与应用价值
- 多队列数据整合分析: 整合PCAWG、TCGA等多源数据,开展跨队列的癌症基因组特征研究