数据集概述
本数据集配套“Genes Underlying Adaptive Physiological Shifts Among Hibernating Mammals”手稿,包含基因组、系统发育及功能富集数据,用于研究哺乳动物冬眠相关性状(尤其是肉碱代谢)的进化机制,覆盖物种树、基因树、功能富集等多类型资源。
文件详解
- 系统发育资源
- 文件名称:RERConverge_120MasterTree.tre
- 文件格式:Newick(.tre)
- 字段映射介绍:120种哺乳动物的物种树,用于RERconverge检测基因特异性进化速率变化
- 文件名称:206Species_MasterTree.tre
- 文件格式:Newick(.tre)
- 字段映射介绍:含206个物种的完整物种树(覆盖404个肉碱相关基因),用于选择分析前的基因树修剪
- 文件名称:19610_mammalGeneTrees.txt
- 文件格式:纯文本(多行Newick)
- 字段映射介绍:120个哺乳动物基因组的19,610个基于蛋白质的基因树
- 文件名称:19610_mammalGeneTrees.trees
- 文件格式:序列化(.trees,RERconverge兼容)
- 字段映射介绍:19,610个基因树的序列化版本,适用于RERconverge流程
- 文件名称:TimeTree_SpeciesList_Metadata.txt
- 文件格式:纯文本
- 字段映射介绍:物种列表及分歧时间估计的协调说明,含物种替换和手动放置记录
- 功能富集数据
- 文件名称:RawEnrichmentData.xlsx
- 文件格式:Excel(.xlsx)
- 字段映射介绍:包含GO、KEGG、UniProt功能富集分析数据,含5个工作表:Summary_Unique_Enrichment(选择组特有的富集GO术语)、ALL_371_GenesVS_ALL_Human(371个肉碱相关基因与人类全基因组的富集对比)、PosSelGenesVS_ALL_Human(正选择基因的富集结果)、RelaxedSelGenesVS_ALL_Human(放松选择基因的富集结果)、33_RERGenes_VS_19610_background(33个RERconverge显著基因与19,610个背景基因的富集对比)
数据来源
论文“Genes Underlying Adaptive Physiological Shifts Among Hibernating Mammals”
适用场景
- 冬眠基因进化分析: 研究哺乳动物冬眠相关性状(如肉碱代谢)的趋同进化机制
- 系统发育树构建: 利用物种树和基因树资源开展哺乳动物系统发育关系研究
- 功能富集分析: 通过GO、KEGG等数据挖掘冬眠相关基因的生物学功能
- 进化速率变化检测: 基于RERconverge流程分析基因特异性进化速率偏移
- 肉碱代谢通路研究: 探索肉碱相关基因在冬眠适应性生理转变中的作用