数据集概述
本数据集为韩国队列结直肠癌(CRC)的RNA-seq综合分析结果,包含214名参与者的381份样本(169份正常组织、212份肿瘤组织)的基因表达数据。识别出19,575个表达基因及3,830个差异表达基因,涉及细胞周期、代谢通路等功能注释,还结合临床信息与CMS亚型分析,为CRC分子机制研究提供参考,共含11个文件。
文件详解
- 表达量数据文件(TXT格式)
- 文件名称:遵循
CMCBSN_log2cpm_*.txt(如CMCBSN_log2cpm_342.txt)、CMCBSN_expectedcount_*.txt(如CMCBSN_expectedcount_381.txt)模式
- 文件格式:TXT
- 字段映射介绍:包含样本ID(如PM-PM-1070-N-A1)作为列名,记录基因的log2cpm标准化表达量或预期计数
- 补充表格文件(XLSX格式)
- 文件名称:
Supplementary table1.xlsx至Supplementary table5.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含研究相关的补充信息,推测涵盖差异表达基因注释、功能富集结果、临床信息关联、CMS亚型分析等内容
适用场景
- 结直肠癌分子机制研究: 分析肿瘤与正常组织的差异表达基因,探究CRC发生发展的关键通路(如细胞周期、IL-17通路)
- 临床亚型关联分析: 结合CMS亚型与临床信息,研究CRC分子亚型的临床特征及预后价值
- 治疗靶点挖掘: 基于差异表达基因的功能注释,筛选CRC潜在治疗靶点
- 转录组数据分析方法验证: 利用标准化表达量数据验证基因表达分析算法的有效性
- 队列特异性分子特征研究: 探索韩国CRC患者特有的基因表达模式与分子特征