数据集概述
本数据集为小鼠睾丸单细胞RNA测序的处理数据,来自研究5种小鼠品系睾丸基因调控与病理学的统一单细胞分析。包含细胞元数据、标准化表达矩阵、基因注释、基因本体富集等关键分析结果,以及质控、基因调控概率矩阵等辅助数据,支持对睾丸细胞类型、基因表达模式及调控机制的研究。
文件详解
- 核心分析对象压缩包:
- 文件名称:
SDA_objects.zip
- 文件格式:ZIP
- 字段映射介绍:包含6类关键数据对象,解压后可用于Shiny应用
cell_data:细胞元数据(80列,含细胞ID、SDA成分细胞得分、tSNE坐标、伪时间、实验组等)
data:标准化基因表达稀疏矩阵(20322个细胞×19262个基因)
gene_annotations:基因注释(含基因位置、组织富集度、不育基因状态)
GO_enrich:基因本体富集结果(各成分的富集基因、p值、富集值)
principal_curves:伪时间轨迹列表(princurve()输出)
SDAresults:SDA分析结果(SDAtools::load_results()加载)
- 辅助R数据对象(RDS格式):
QC_count_matrix.rds:质控用原始计数稀疏矩阵
cell_imputation_AUCs.rds:细胞插补方法的PRAC AUC值(含未插补、均值、SDA、ICA等方法)
HocomocoV11_motifProbs_matrix.rds:HocomocoV11数据库基序的调控概率矩阵
motifFinder_denovo.rds:启动子区域从头基序分析结果列表
motifFinder_denovo_fixed.rds:125个从头基序在所有基因上的固定基序分析结果列表
tomtom_matched_motifs.rds:从头基序的TOMTOM匹配结果及元数据
数据来源
论文“Unified single-cell analysis of testis gene regulation and pathology in 5 mouse strains”(GEO编号:GSE113293)
适用场景
- 睾丸单细胞基因表达分析: 利用标准化表达矩阵和细胞元数据,识别小鼠睾丸细胞类型及特异性基因表达模式
- 基因调控机制研究: 通过SDA结果、基序概率矩阵和富集分析,解析睾丸细胞中基因调控网络及关键转录因子
- 数据插补方法评估: 基于细胞插补AUC值,比较不同插补算法在单细胞RNA测序数据中的性能
- 病理学机制探索: 结合5种小鼠品系的实验分组数据,研究睾丸病理状态下的基因表达变化及调控异常
- 生物信息学工具开发: 利用标准化处理数据验证单细胞分析算法(如SDA、ICA、MAGIC等)的有效性