GESTALT_Based_全生物体谱系追踪基因组编辑实验数据

数据集概述

本数据集为全生物体谱系追踪实验数据,基于组合与累积基因组编辑技术(GESTALT)生成。通过CRISPR/Cas9靶向位点阵列作为DNA条形码,记录细胞分裂过程中的突变积累,以解析细胞谱系关系。包含细胞培养、斑马鱼胚胎及成体样本的谱系数据,共13个文件。

文件详解

  • 谱系树文件(.newick格式)
  • 文件名称:embryos_1_7.newick、fish_ADR2_PHYLIP_MIX_gte5_output.newick、fish_ADR1_PHYLIP_MIX_gte5_output.newick、cell_culture_gte2_MIX_output.newick
  • 文件格式:NEWICK
  • 字段映射介绍:存储细胞谱系树结构,反映细胞间的谱系关系
  • 数据文件(.json格式)
  • 文件名称:fish_ADR2_PHYLIP_MIX_gt5.json、fish_ADR1_PHYLIP_MIX_gte5.json、cell_culture_gte2.json、embryos_1_7.json
  • 文件格式:JSON
  • 字段映射介绍:包含谱系追踪的结构化数据,可能涉及细胞突变模式、样本信息等
  • 输入文本文件(.txt格式)
  • 文件名称:fish_ADR1_PHYLIP_MIX_gte5_input.txt、fish_ADR2_PHYLIP_MIX_gte5_input.txt、cell_culture_gte2_input_MIX.txt
  • 文件格式:TXT
  • 字段映射介绍:存储实验输入数据,包含样本编号、条形码序列等信息(如fish_ADR2_PHYLIP_MIX_gte5_input.txt含302个样本、2072个位点的条形码数据)
  • 压缩文件(.bz2格式)
  • 文件名称:all_stats_files.tar.bz2
  • 文件格式:BZ2
  • 字段映射介绍:压缩包,包含所有统计相关文件
  • 混合数据文件(.mix格式)
  • 文件名称:embryos_1_7.mix
  • 文件格式:MIX
  • 字段映射介绍:存储胚胎样本的混合数据,可能包含多类型谱系追踪信息

数据来源

论文“Whole organism lineage tracing by combinatorial and cumulative genome editing”

适用场景

  • 细胞谱系追踪研究:解析细胞分裂过程中的谱系关系,探究胚胎发育及成体器官细胞来源
  • 基因组编辑技术验证:评估GESTALT技术在细胞谱系追踪中的有效性与准确性
  • 斑马鱼发育研究:分析斑马鱼胚胎至成体的细胞谱系分化模式
  • 生物医学研究:为疾病发生机制、细胞分化研究提供谱系追踪数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 69.41 MiB
最后更新 2026年1月28日
创建于 2026年1月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。