甲壳动物肢体发育与再生基因表达动态补充数据集

数据集概述

本数据集为《甲壳动物肢体发育与再生过程中的基因表达动态》研究论文的补充数据,包含基因表达量、聚类分析结果、序列注释等多类型文件,支持论文结论的验证与扩展分析。

文件详解

  • 数据文件(CSV格式,共26个):
  • 聚类分析类:Dataset_S25_jags_mfuzz_E_4cl_centres_v2.csv(4个胚胎发育聚类中心数据)、Dataset_S28_jags_mfuzz_D_12cl_centre_v3.csv(12个再生过程聚类中心数据)等,含cluster(聚类编号)及各样本表达量字段
  • 表达量类:Dataset_S10_20_samples_abundance_gene_tpm_...csv(20个样本基因TPM值)、Dataset_S7_122_samples_abundance_gene_est_counts_...txt(122个样本基因估计计数)等,含RNAseq_gene_ID(基因ID)及各样本表达量字段
  • 基因列表类:Dataset_S16_List_20k_varEDR.txt(2万个高变异基因列表),字段为MSTRG开头的基因ID
  • 注释文件(TXT/GTF格式,共4个):
  • Dataset_S1_Annotation_Reg_Embryo_500_cleanOverlap0.5_3.txt(胚胎与再生基因注释文本)
  • Dataset_S1_Annotation_Reg_Embryo_500_cleanOverlap0.5_3.gtf.zip(GTF格式注释压缩包)
  • 序列文件(ZIP格式):
  • Dataset_S31_ph-pacbio-sequel2-isoseq3-css99.fasta.zip(PacBio Iso-Seq测序序列压缩包)
  • 分析脚本与数据(ZIP/GZ格式,共4个):
  • R_data_Sinigaglia_Embryo_reg_05042022-20220407T075816Z.zip(R语言分析数据压缩包)
  • DESeq2_lresO_molt.gz(DESeq2差异分析结果压缩包)

适用场景

  • 甲壳动物发育生物学研究:分析肢体发育与再生过程的基因表达模式差异
  • 进化生物学研究:探究肢体再生相关基因的进化保守性
  • 生物信息学方法验证:测试基因表达聚类(mfuzz)、差异分析(DESeq2)等算法的应用效果
  • 再生医学基础研究:挖掘调控肢体再生的关键基因靶点
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 782.81 MiB
最后更新 2025年12月12日
创建于 2025年12月12日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。