数据集概述
该数据集围绕基因、分子通路及疾病相关类别对化学暴露的敏感性展开,包含化学-基因互作、基因互作计数、通路富集分析及疾病-通路关联矩阵等核心数据,为研究化学暴露的分子机制提供基础支持。
文件详解
- Annotated chemical-gene interactions.xlsx:Excel格式,包含591,084条化学-基因互作数据,化学物质标注有主要用途(如药物、污染物等),基因经跨物种过滤。
- Number of chemical-gene interactions per gene.xlsx:Excel格式,统计每个基因的化学-基因互作总数、激活及抑制互作数,用于衡量基因对化学暴露的敏感性。
- Enrichment of molecular pathways with genes sensitive to chemical exposures.xlsx:Excel格式,通过GSEA分析得到的分子通路富集结果,含Hallmark、KEGG、Reactome通路的标准化富集分数(NES)。
- Diseases vs. chemically sensitive KEGG pathways matrix.xlsx:Excel格式,疾病与化学敏感KEGG通路的关联矩阵,含通路关联数及基因重叠数。
- Diseases vs. chemically sensitive Reactome pathways matrix.xlsx:Excel格式,疾病与化学敏感Reactome通路的关联矩阵,含通路关联数及基因重叠数。
数据来源
Comparative Toxicogenomic Database (CTD)、Wikipedia、PubChem、PubMed、Gene-Set Enrichment Analysis (GSEA)
适用场景
- 毒理学研究:分析化学物质对基因及分子通路的影响机制
- 环境健康研究:探究环境化学暴露与疾病敏感性的关联
- 药物研发:识别化学暴露敏感的分子通路,辅助药物靶点筛选
- 公共卫生:评估化学污染物对人群健康风险的潜在影响
- 生物信息学:构建化学-基因-疾病关联网络模型