数据集概述
本数据集来源于WES MM(全外显子测序多发性骨髓瘤)研究项目,包含280例多发性骨髓瘤患者的临床信息、全外显子测序突变数据(MAF格式)以及转录组表达矩阵。数据涵盖临床特征分析、差异表达基因识别、KEGG通路富集、特征选择和预测模型构建等多个分析环节,为多发性骨髓瘤的基因组学研究提供全面的生物信息学资源。
文件详解
- 临床与基础数据文件
- 文件名称:
Table S1-clinical info of 280 patients.csv
- 文件格式: CSV
- 字段映射介绍: 包含280例多发性骨髓瘤患者的基本临床信息,如患者编号、诊断指标、治疗历史等。
- 文件名称:
MMRF count.csv、Table S2-MMRF count.csv
- 文件格式: CSV
- 字段映射介绍: 转录组表达量矩阵文件,行代表基因,列代表患者样本(如MMRF1021等),数值为基因表达水平。
- 基因组变异数据
- 文件名称:
myeloma.maf
- 文件格式: MAF
- 字段映射介绍: 全外显子测序得到的突变注释文件,记录样本中的基因突变信息,包括突变类型、位置、基因名称等。
- 分析结果文件
- 文件名称:
Table S3-DEG.csv
- 文件格式: CSV
- 字段映射介绍: 差异表达基因分析结果,包含显著差异表达的基因列表及统计量。
- 文件名称:
Table S4-KEGG.csv
- 文件格式: CSV
- 字段映射介绍: KEGG通路富集分析结果,展示差异基因显著富集的信号通路。
- 文件名称:
Table S5-cv_feature selection.CSV
- 文件格式: CSV
- 字段映射介绍: 特征选择结果,包含基因名称(如FAM120A)及其对应的交叉验证重要性评分(cv值)。
- 文件名称:
Table S6-predictive model.csv、Table S7.csv
- 文件格式: CSV
- 字段映射介绍: 预测模型相关参数或结果文件,可能包含模型构建的关键基因或性能指标。
数据来源
WES MM project
适用场景
- 多发性骨髓瘤基因组学研究: 利用WES数据分析基因突变谱,探索与疾病发生发展相关的驱动基因。
- 肿瘤生物标志物发现: 结合临床信息与转录组数据,筛选与预后或治疗反应相关的分子标志物。
- 癌症信号通路分析: 通过KEGG富集分析揭示多发性骨髓瘤中异常激活的关键生物学通路。
- 机器学习模型构建: 基于特征选择结果构建疾病分类或预后预测模型,支持精准医疗应用。