数据集概述
本数据集包含GM12878和K562细胞系的基因相关数据,涵盖样本基础信息、GpC可及性峰位置、多向增强子统计、基因位点与表达量化整合数据及差异表达基因列表,为基因相关研究提供支持。
文件详解
- supplementarytable1_datasets_stat.xlsx:Excel格式,包含GM12878和K562细胞系重复样本的基础信息
- supplementarytable2_GpC_peaks.xlsx:Excel格式,包含GpC可及性峰的位置信息
- supplementarytable3_1_GM12878_ME_stat_20k.zip:压缩文件,包含GM12878细胞系的多向增强子统计数据
- supplementarytable3_1_K562_ME_stat_20k.zip:压缩文件,包含K562细胞系的多向增强子统计数据
- supplementarytable4_gene_PIVOT_DF.xlsx:Excel格式,整合基因位点信息、RNA-seq表达量化(TPM值)、多向增强子比例、GpC可及性等数据
- supplementarytable5_diffgene.xlsx:Excel格式,列出通过limma识别的差异表达基因(DEGs)
适用场景
- 细胞生物学研究:分析GM12878和K562细胞系的基因表达与调控特征
- 表观遗传学分析:探究GpC可及性峰与基因表达的关联
- 增强子功能研究:研究多向增强子对基因表达的调控作用
- 差异基因分析:识别不同细胞系间的差异表达基因及其潜在功能