数据集概述
本数据集为全生物体谱系追踪实验数据,基于组合与累积基因组编辑技术(GESTALT)生成。通过CRISPR/Cas9靶向位点阵列作为DNA条形码,记录细胞分裂过程中的突变积累,以解析细胞谱系关系。包含细胞培养、斑马鱼胚胎及成体样本的谱系数据,共13个文件。
文件详解
- 谱系树文件(.newick格式)
- 文件名称:embryos_1_7.newick、fish_ADR2_PHYLIP_MIX_gte5_output.newick、fish_ADR1_PHYLIP_MIX_gte5_output.newick、cell_culture_gte2_MIX_output.newick
- 文件格式:NEWICK
- 字段映射介绍:存储细胞谱系树结构,反映细胞间的谱系关系
- 数据文件(.json格式)
- 文件名称:fish_ADR2_PHYLIP_MIX_gt5.json、fish_ADR1_PHYLIP_MIX_gte5.json、cell_culture_gte2.json、embryos_1_7.json
- 文件格式:JSON
- 字段映射介绍:包含谱系追踪的结构化数据,可能涉及细胞突变模式、样本信息等
- 输入文本文件(.txt格式)
- 文件名称:fish_ADR1_PHYLIP_MIX_gte5_input.txt、fish_ADR2_PHYLIP_MIX_gte5_input.txt、cell_culture_gte2_input_MIX.txt
- 文件格式:TXT
- 字段映射介绍:存储实验输入数据,包含样本编号、条形码序列等信息(如fish_ADR2_PHYLIP_MIX_gte5_input.txt含302个样本、2072个位点的条形码数据)
- 压缩文件(.bz2格式)
- 文件名称:all_stats_files.tar.bz2
- 文件格式:BZ2
- 字段映射介绍:压缩包,包含所有统计相关文件
- 混合数据文件(.mix格式)
- 文件名称:embryos_1_7.mix
- 文件格式:MIX
- 字段映射介绍:存储胚胎样本的混合数据,可能包含多类型谱系追踪信息
数据来源
论文“Whole organism lineage tracing by combinatorial and cumulative genome editing”
适用场景
- 细胞谱系追踪研究:解析细胞分裂过程中的谱系关系,探究胚胎发育及成体器官细胞来源
- 基因组编辑技术验证:评估GESTALT技术在细胞谱系追踪中的有效性与准确性
- 斑马鱼发育研究:分析斑马鱼胚胎至成体的细胞谱系分化模式
- 生物医学研究:为疾病发生机制、细胞分化研究提供谱系追踪数据支持