数据集概述
本数据集是论文《Defining Peptides in ChEBI》的补充数据,包含肽本体修订文件、一阶逻辑定义文件、PubChem和ChEBI分子分类结果、人工评估表格及专家调查问卷等8个文件,为肽类化合物的定义与分类研究提供支撑。
文件详解
- Additional File 1: chemlog.omn,格式为OWL Manchester Syntax,内容为修订后的肽本体
- Additional File 2: substructures_fol.tptp,格式为TPTP Syntax,内容为2,5-二酮哌嗪和埃默里酰胺的一阶逻辑(FOL)定义
- Additional File 3: proteinogenics_fol.tptp,格式为TPTP Syntax,内容为蛋白质氨基酸残基的一阶逻辑(FOL)定义
- Additional File 4: pubchem_classification_results.zip,格式为ZIP压缩包,内容为PubChem分子分类结果(JSON格式)
- Additional File 5: chebi_classification_results.json,格式为JSON,内容为ChEBI分子分类结果
- Additional File 6: chebi_3_star_molecules_manual_eval.ods,格式为OpenDocument Spreadsheet,内容为ChEBI未被自动分类为阳性的分子人工评估结果
- Additional File 7: questionnaire_peptide_classification.odt,格式为OpenDocument Text,内容为专家调查所用问卷
- Additional File 8: questionnaire_peptide_classification.pdf,格式为PDF,内容为专家调查所用问卷
适用场景
- 生物化学研究:用于肽类化合物的本体构建与定义研究
- 计算化学分析:支撑分子分类算法的开发与验证
- 数据库优化:辅助ChEBI等生物分子数据库的肽类化合物分类体系完善
- 专家共识研究:为肽类分类标准的专家调查与共识形成提供工具支持