乳腺癌基因表达谱数据集

数据集概述

该数据集包含四组独立的乳腺癌基因表达谱数据,涵盖不同临床特征的样本,包括正常组织与癌组织、复发与非复发病灶、病理完全缓解与残留病灶样本,以及模拟生成的特征数据,为乳腺癌分类研究提供多组学数据支持。

文件详解

  • 文件名称:BC-TCGA.zip
  • 文件格式:ZIP压缩包
  • 内容说明:包含17814个基因、590个样本,其中正常组织样本61个,乳腺癌组织样本529个
  • 文件名称:GSE2034.zip
  • 文件格式:ZIP压缩包
  • 内容说明:包含12634个基因、286个乳腺癌样本,其中复发肿瘤样本107个,无复发样本179个
  • 文件名称:GSE25066.zip
  • 文件格式:ZIP压缩包
  • 内容说明:包含12634个基因、492个乳腺癌样本,其中病理完全缓解样本100个,残留病灶样本392个
  • 文件名称:Simulation-Data.zip
  • 文件格式:ZIP压缩包
  • 内容说明:包含100个阳性样本与100个阴性样本,共10000个特征,特征分别服从不同参数的正态分布

适用场景

  • 癌症分型研究:基于基因表达谱数据构建乳腺癌亚型分类模型
  • 临床预后分析:探究基因表达与乳腺癌复发、病理缓解的关联
  • 特征选择算法验证:用于评估随机投影等降维技术在癌症分类中的效果
  • 生物标志物筛选:识别与乳腺癌临床特征相关的关键基因标志物
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 105.41 MiB
最后更新 2025年11月27日
创建于 2025年11月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。