数据集概述
该数据集为Galaxy平台CRISPR筛选分析教程配套数据,包含原始测序数据、分析配置文件、结果报告等多种类型文件,覆盖CRISPR实验从原始数据到分析结果的全流程,为学习和实践CRISPR筛选数据分析提供完整支持。
文件详解
该数据集包含10个文件,具体说明如下:
- 原始测序数据文件(.gz格式):
- T0-Control.fastq.gz: 对照组原始测序数据
- T8-APR-246.fastq.gz: 处理组(APR-246)原始测序数据
- T8-Vehicle.fastq.gz: 溶剂对照组原始测序数据
- 分析配置与参考文件:
- adapter_list.tsv: 适配器序列列表,包含Illumina通用适配器、小RNA适配器等序列信息
- brunello.tsv: sgRNA库信息,包含ID、序列、靶基因等字段(如ID_1对应A1BG基因的sgRNA序列)
- h.all.v7.4.symbols.gmt: 基因集注释文件
- 分析结果文件:
- kenji_mageck_count_summary.tsv: MAGeCK计数分析摘要结果
- kenji_mageck_count_report.pdf: MAGeCK计数分析报告
- kenji_mageck_mle_design_matrix.tsv: MAGeCK MLE分析设计矩阵
- kenji_mageck_sgrna_counts.tsv: sgRNA计数结果
适用场景
- CRISPR筛选数据分析教学: 作为Galaxy平台教程的配套数据,用于学习CRISPR筛选数据处理流程
- 生物信息学实践: 用于CRISPR sgRNA计数、差异分析等生物信息学方法的实践操作
- 基因功能研究: 辅助研究特定基因在CRISPR筛选实验中的作用
- 测序数据分析: 用于学习高通量测序原始数据(fastq.gz)的处理与分析