数据集概述
本数据集包含Minaeva et al. 2024研究中使用的原始及处理后文件,覆盖40种常见细胞系,修订了调控网络构建流程,包含数据集统计、网络富集、基准测试、转录因子活性分析及疾病富集等多类结果文件,支持细胞特异性基因调控程序的探索。
文件详解
- 1-dataset_stats子目录
- per_gene_stats_{approach}_{cell_line}.tsv:TSV格式,记录特定细胞系中不同方法(S2Mb、M2Kb、S2Kb)下调控每个基因的转录因子数量
- per_tf_stats_{approach}_{cell_line}.tsv:TSV格式,记录特定细胞系中不同方法下每个转录因子调控的靶基因数量
- 1-network_enrichment子目录
- enrich_scores_remap_all_tfs_K562.tsv:TSV格式,K562细胞系调控网络在其他生物网络(PPI、共表达等)中的富集分析结果
- 2-plot_decoupler_comparison_benchmark_across_cells子目录
- {cell_line}_comparison_benchmark.tsv:TSV格式,K562/HepG2/MCF7细胞系中多种调控网络(S2Mb、M2Kb、CollecTri等)的基准测试结果
- 2-plot_decoupler_filter_benchmark_across_methods子目录
- {cell_line}_filtering_benchmark.tsv:TSV格式,K562/HepG2/MCF7细胞系中不同过滤条件下S2Mb、M2Kb、S2Kb调控网络的基准测试结果
- 3-tf_activity子目录
- aml_k562_activity_{regulon}_sc.tsv:TSV格式,健康造血干细胞与AML异常祖细胞间转录因子活性分析结果
- aml_activity_estimates_hsc_sc.tsv:TSV格式,健康造血干细胞与AML异常祖细胞间差异转录因子活性分析摘要
- aml_dhsc_ahsc_activity_{regulon}_sc.tsv:TSV格式,白血病激活与休眠造血干细胞间转录因子活性分析结果
- aml_activity_estimates_dhsc_ahsc_sc.tsv:TSV格式,白血病激活与休眠造血干细胞间差异转录因子活性分析摘要
- bc_bas_activity_{regulon}.tsv:TSV格式,健康乳腺上皮细胞与基底型乳腺癌细胞间转录因子活性分析结果
- bc_activity_estimates_bas.tsv:TSV格式,健康乳腺上皮细胞与基底型乳腺癌细胞间差异转录因子活性分析摘要
- bc_lum_activity_{regulon}.tsv:TSV格式,健康乳腺上皮细胞与 luminal A型乳腺癌细胞间转录因子活性分析结果
- bc_activity_estimates_lum.tsv:TSV格式,健康乳腺上皮细胞与 luminal A型乳腺癌细胞间差异转录因子活性分析摘要
- hep_activity_{regulon}.tsv:TSV格式,正常肝细胞与肿瘤肝细胞间转录因子活性分析结果
- hep_activity_estimates.tsv:TSV格式,正常肝细胞与肿瘤肝细胞间差异转录因子活性分析摘要
- 3-tf_disease_enrichment子目录
- aml_{database}enrich{regulon}_hsc_sc.tsv:TSV格式,健康造血干细胞与AML异常祖细胞间差异转录因子的疾病富集分析结果(数据库含COSMIC、DisGeNet等)
- aml_{database}enrich{regulon}_dhsc_ahsc_sc.tsv:TSV格式,白血病激活与休眠造血干细胞间差异转录因子的疾病富集分析结果(数据库含COSMIC、DisGeNet等)
- bc_{database}enrich{regulon}_bas.tsv:TSV格式,健康乳腺上皮细胞与基底型乳腺癌细胞间差异转录因子的疾病富集分析结果(数据库含COSMIC、DisGeNet等)
- bc_{database}enrich{regulon}_lum.tsv:TSV格式,健康乳腺上皮细胞与luminal A型乳腺癌细胞间差异转录因子的疾病富集分析结果(数据库含COSMIC、DisGeNet等)
- hep_{database}enrich{regulon}.tsv:TSV格式,正常肝细胞与肿瘤肝细胞间差异转录因子的疾病富集分析结果(数据库含COSMIC、DisGeNet等)
- regulons子目录
- {cell_line}_regulon.tsv:TSV格式,本研究生成的特定细胞系S2Mb、M2Kb、S2Kb调控网络及注释
- ChIP-Atlas_target_genes_{cell_line}.tsv:TSV格式,用于比较的定制化ChIP-Atlas调控网络
- Revised_Supplemental_Table_S3_Normal.csv:CSV格式,Dorothea调控网络(来自Garcia-Alonso et al. 2019补充材料)
- s3-network_enrichment子目录
- enrich_scores_remap_all_tfs_{cell_line}.tsv:TSV格式,特定细胞系调控网络在PPI网络中的富集分析结果
数据来源
Minaeva et al. 2024研究,代码可在GitHub - LappalainenLab/chip_seq_regulons获取
适用场景
- 细胞特异性基因调控研究:分析不同细胞系中转录因子调控网络的特征与差异
- 转录因子调控网络基准测试:评估不同方法构建的调控网络的性能与准确性
- 疾病相关转录因子分析:探究白血病、乳腺癌、肝癌等疾病中差异转录因子的功能与机制
- 基因调控网络疾病富集研究:关联差异转录因子与疾病数据库,挖掘疾病发生的分子机制
- 细胞系调控网络资源整合:为40种常见细胞系提供标准化的转录因子调控网络数据支持