数据集概述
本数据集是Wilson等人2025年发表的“snrnaseq-step1-preprocessing”代码对应的玩具输入数据,用于测试该代码的数据集构建和预处理功能。代码针对单细胞核RNA测序数据设计,数据集包含五个压缩文件,可直接放入代码仓库的“data”目录运行测试。
文件详解
- scrublet_files.zip
- 文件格式:ZIP
- 字段映射介绍:未提供预览内容,推测包含用于scrublet工具(细胞污染检测)的相关输入文件
- marker_gene_database.zip
- 文件格式:ZIP
- 字段映射介绍:未提供预览内容,推测包含基因标记数据库相关文件
- CellBender_output_files.zip
- 文件格式:ZIP
- 字段映射介绍:未提供预览内容,推测包含CellBender工具(背景降噪)的输出文件
- demuxlet_singlet_barcode_files.zip
- 文件格式:ZIP
- 字段映射介绍:未提供预览内容,推测包含demuxlet工具识别的 singlet 细胞条形码文件
- demuxlet_sng_dbl_amb_counts_files.zip
- 文件格式:ZIP
- 字段映射介绍:未提供预览内容,推测包含demuxlet工具输出的 singlet、doublet、ambiguous 细胞计数文件
数据来源
Wilson et al. 2025(https://doi.org/10.1101/2025.02.05.636667)
适用场景
- 生物信息学代码测试: 用于验证“snrnaseq-step1-preprocessing”代码的数据集构建和预处理流程
- 单细胞核RNA测序数据分析: 作为预处理步骤的输入示例,辅助理解scrublet、CellBender、demuxlet等工具的使用
- 生物信息学教学: 用于教学场景中,演示单细胞核RNA测序数据预处理的代码运行和结果验证
- 研究重现: 辅助重现Wilson等人2025年研究中涉及的单细胞核RNA测序数据预处理步骤