数据集概述
本数据集为ScUnicorn研究配套数据,用于支持单细胞Hi-C数据的盲超分辨率增强及3D基因组结构重建研究。包含训练、验证、测试用数据文件及批量Hi-C数据压缩包,可辅助验证ScUnicorn框架及3DUnicorn算法性能,助力单细胞水平3D染色体结构分析。
文件详解
- train.npz
- 文件格式:NPZ
- 字段映射介绍:训练用数据文件,包含用于ScUnicorn框架训练的单细胞Hi-C相关数据
- valid.npz
- 文件格式:NPZ
- 字段映射介绍:验证用数据文件,用于ScUnicorn框架的验证过程
- test.npz
- 文件格式:NPZ
- 字段映射介绍:测试用数据文件,用于评估ScUnicorn框架及3DUnicorn算法的性能
- Bulk_HiC_Data.zip
- 文件格式:ZIP
- 字段映射介绍:批量Hi-C数据压缩包,包含研究中涉及的批量Hi-C参考数据
数据来源
论文“Unicorn: Enhancing Single-Cell Hi-C Data with Blind Super-Resolution for 3D Genome Structure Reconstruction”
适用场景
- 单细胞基因组学算法开发: 用于测试和优化单细胞Hi-C数据增强算法(如ScUnicorn)的性能
- 3D基因组结构生物学研究: 结合增强后的数据,辅助精确推断染色体3D结构,探索基因组空间组织机制
- 生物信息学模型验证: 验证基于最大似然法的3D结构重建算法(如3DUnicorn)的准确性
- 基因组数据增强技术评估: 对比传统超分辨率方法与盲超分辨率框架在保留生物模式、降低噪声方面的效果