数据集概述
本数据集提供SARS-CoV-2、SARS-CoV和MERS三种冠状病毒蛋白的CATH功能家族(FunFams)分配结果。CATH v4.3版本因在新冠疫情前发布未包含相关数据,本数据通过HMMER3扫描UniProt条目并经cath-resolve-hits处理生成,共含4个文件,支持病毒蛋白功能分析。
文件详解
- 核心功能分配文件(.crh格式)
- 文件名称:sars.crh、covid_up_4.3_notc.crh、mers.crh
- 文件格式:.crh
- 字段映射介绍:记录对应病毒蛋白序列与CATH v4.3 FunFams隐马尔可夫模型匹配的功能家族分配结果,包含序列比对及解析信息
- 补充数据文件(.json格式)
- 文件名称:covid_up_4.3_notc.json
- 文件格式:.json
- 字段映射介绍:SARS-CoV-2蛋白功能家族分配的补充结构化数据,具体字段未提供预览
适用场景
- 冠状病毒蛋白功能分析: 用于研究SARS-CoV-2、SARS、MERS病毒蛋白的功能分类与保守性特征
- 病毒进化研究: 通过功能家族分配差异分析三种冠状病毒的进化关系
- 药物靶点发现: 基于蛋白功能家族定位潜在的抗病毒药物靶点
- 生物信息学算法验证: 测试蛋白功能注释工具在新发病毒序列中的应用效果