数据集概述
本数据集包含用于支持论文研究的多组学数据表,涵盖甲基化、RNA、蛋白质组和脂质组四类组学技术的标准化测量数据,无身份识别信息。数据用于识别X-连锁肾上腺脑白质营养不良中脑脱髓鞘的表型修饰因子,共包含十一个文件,支持研究结果的复现与进一步分析。
文件详解
- 样本映射文件
- 文件名称:20180314_sib_pairs.xlsx
- 文件格式:XLSX
- 字段映射介绍:描述家族编号等信息,作为下方表格的样本映射表
- 甲基化数据文件
- 文件名称:DMRs_5_Families_ALL_0.10DB_Dec2019.csv
- 文件格式:CSV
- 字段映射介绍:单家族排除时delta beta至少百分之十的显著甲基化区域数据
- 文件名称:ALD_Deconvoluted_Betas_Dec2019.csv
- 文件格式:CSV
- 字段映射介绍:所有受试者单个CpG位点的拟合beta值
- 文件名称:ALD_Limma_Final_Dec2019_CHR.csv
- 文件格式:CSV
- 字段映射介绍:每个CpG位点通过limma建模得到的所有拟合效应
- RNA数据文件
- 文件名称:Count_data.txt
- 文件格式:TXT
- 字段映射介绍:通过featureCounts在基因水平求和的原始计数表,包含Geneid、Length及各样本(如ALD10.bam)的计数
- 文件名称:Pvalues_all_23_01_2019.csv
- 文件格式:CSV
- 字段映射介绍:建模过程中纳入基因的所有p值和对数倍变化(含家族排除分析)
- 文件名称:Tmm_norm_counts_5_2_2020.csv
- 文件格式:CSV
- 字段映射介绍:TMM标准化后的RNA计数数据,包含基因ID及各样本(如ALD11.bam)的标准化计数
- 蛋白质组数据文件
- 文件名称:Report_Precursor_Peptides.xls
- 文件格式:XLS
- 字段映射介绍:蛋白质组数据表格
- 文件名称:Pvalues_prot_13_3_2019.xlsx
- 文件格式:XLSX
- 字段映射介绍:蛋白质组数据的p值和对数倍变化(含家族排除分析)
- 脂质组数据文件
- 文件名称:Lipid_data.csv
- 文件格式:CSV
- 字段映射介绍:去除缺失值后的脂质代谢物数据
- 文件名称:Pvalues_lipids.csv
- 文件格式:CSV
- 字段映射介绍:脂质数据的p值(含家族排除分析),包含lipidid、pvalues_ALD_CTRL、logf2c_ald_ctrl等字段
数据来源
论文“Multi-omic approach to identify phenotypic modifiers underlying cerebral demyelination in X-linked adrenoleukodystrophy”
适用场景
- X-连锁肾上腺脑白质营养不良表型修饰因子研究: 利用多组学数据识别与脑脱髓鞘相关的表型修饰因子
- 神经系统疾病多组学整合分析: 整合甲基化、RNA、蛋白质组和脂质组数据,探究疾病分子机制
- 医学研究结果复现: 基于数据集复现论文中的分析结果与结论
- 表型修饰因子生物标志物筛选: 从多组学数据中筛选潜在的疾病表型生物标志物
- 家族性疾病遗传修饰机制分析: 通过家族排除分析数据,研究遗传因素对表型的修饰作用