数据集概述
本数据集为《甲壳动物肢体发育与再生过程中的基因表达动态》研究论文的补充数据,包含基因表达量、聚类分析结果、序列注释等多类型文件,支持论文结论的验证与扩展分析。
文件详解
- 数据文件(CSV格式,共26个):
- 聚类分析类:Dataset_S25_jags_mfuzz_E_4cl_centres_v2.csv(4个胚胎发育聚类中心数据)、Dataset_S28_jags_mfuzz_D_12cl_centre_v3.csv(12个再生过程聚类中心数据)等,含cluster(聚类编号)及各样本表达量字段
- 表达量类:Dataset_S10_20_samples_abundance_gene_tpm_...csv(20个样本基因TPM值)、Dataset_S7_122_samples_abundance_gene_est_counts_...txt(122个样本基因估计计数)等,含RNAseq_gene_ID(基因ID)及各样本表达量字段
- 基因列表类:Dataset_S16_List_20k_varEDR.txt(2万个高变异基因列表),字段为MSTRG开头的基因ID
- 注释文件(TXT/GTF格式,共4个):
- Dataset_S1_Annotation_Reg_Embryo_500_cleanOverlap0.5_3.txt(胚胎与再生基因注释文本)
- Dataset_S1_Annotation_Reg_Embryo_500_cleanOverlap0.5_3.gtf.zip(GTF格式注释压缩包)
- 序列文件(ZIP格式):
- Dataset_S31_ph-pacbio-sequel2-isoseq3-css99.fasta.zip(PacBio Iso-Seq测序序列压缩包)
- 分析脚本与数据(ZIP/GZ格式,共4个):
- R_data_Sinigaglia_Embryo_reg_05042022-20220407T075816Z.zip(R语言分析数据压缩包)
- DESeq2_lresO_molt.gz(DESeq2差异分析结果压缩包)
适用场景
- 甲壳动物发育生物学研究:分析肢体发育与再生过程的基因表达模式差异
- 进化生物学研究:探究肢体再生相关基因的进化保守性
- 生物信息学方法验证:测试基因表达聚类(mfuzz)、差异分析(DESeq2)等算法的应用效果
- 再生医学基础研究:挖掘调控肢体再生的关键基因靶点