用于功能预测项目的蛋白质结构收集数据集

数据集概述

本数据集为蛋白质结构功能预测项目的完整数据,包含来自Swiss-Prot的蛋白质序列文件及AlphaFoldDB API的查询结果文件,共2个文件,无目录层级划分,未进行训练/测试、数据/标签或原始/处理数据的拆分。

文件详解

  • 文件名称:swissprot_dataset_fullheader.fasta
  • 文件格式:FASTA
  • 字段映射介绍:Swiss-Prot数据库的蛋白质序列数据集,包含完整头部信息的蛋白质序列数据
  • 文件名称:alphafoldDB_results.json
  • 文件格式:JSON
  • 字段映射介绍:通过AlphaFoldDB API获取的查询结果数据

适用场景

  • 蛋白质功能预测研究:结合蛋白质序列与结构数据,开发或验证功能预测模型
  • 生物信息学数据分析:用于蛋白质结构与序列关联的数据分析工作
  • 蛋白质数据库整合研究:探索Swiss-Prot与AlphaFoldDB数据的融合应用
  • 计算生物学模型训练:为蛋白质相关的机器学习模型提供基础数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 292.57 MiB
最后更新 2026年2月9日
创建于 2026年2月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。