数据集概述
本数据集是PHILHARMONIC方法在三种生物(造礁珊瑚P. damicornis、共生藻C. goreaui、果蝇D. melanogaster)中的应用结果,包含24个文件,涉及功能聚类、基因本体映射、序列信息等内容,用于揭示非模式生物的功能关系与组织架构。
文件详解
- 功能聚类与网络文件
- 文件名称:如dmelanogaster_cluster_graph.tsv、pdamicornis_network.positive.tsv
- 文件格式:.tsv
- 字段映射介绍:包含聚类图结构、网络连接关系等数据,记录功能模块的组成与相互作用
- 聚类结果文件
- 文件名称:如dmelanogaster_clusters.json、pdamicornis_clusters.llm.json
- 文件格式:.json
- 字段映射介绍:存储聚类结果的结构化数据,包括聚类编号、成员蛋白等信息
- 人类可读说明文件
- 文件名称:如dmelanogaster_human_readable.txt、pdamicornis_human_readable.txt
- 文件格式:.txt
- 字段映射介绍:以文本形式呈现聚类的功能描述、成员数量及蛋白列表等易读信息
- 基因本体映射文件
- 文件名称:如dmelanogaster_GO_map.csv、cgoreaui_GO_map.csv
- 文件格式:.csv
- 字段映射介绍:包含蛋白ID、PFAM结构域、GO术语等注释信息,关联蛋白与功能分类
- 序列文件
- 文件名称:如cgoreaui_sequences.fasta、pdamicornis_sequences.fasta
- 文件格式:.fasta
- 字段映射介绍:存储生物的核苷酸或氨基酸序列数据,用于功能分析的基础序列信息
适用场景
- 非模式生物功能基因组学研究: 分析珊瑚、共生藻等非模式生物的基因功能模块与网络组织
- 生物信息方法验证: 以果蝇(模式生物)为参照,验证PHILHARMONIC方法的聚类准确性与可靠性
- 共生关系分子机制研究: 对比珊瑚与其共生藻的功能模块,探究共生关系的分子基础
- 基因本体功能注释: 利用GO映射文件,丰富非模式生物的基因功能注释信息
- 生物网络分析: 基于预测的功能网络,研究生物体内的功能协作与调控机制