UniProtKB_Swiss_Prot数据库抗菌肽序列挖掘数据集

数据集概述

该数据集包含从UniProtKB/Swiss-Prot数据库2022_02版本中挖掘的候选抗菌肽序列,以及使用AMPlify v2.0.0预测的抗菌肽序列数据,为抗菌肽相关研究提供了结构化的数据支持。

文件详解

  • 数据文件(.tsv格式):
  • uniprot_sprot_putative_amps_by_amplify.tsv:包含候选抗菌肽序列的详细信息,核心字段包括Parent_entry_ID、Parent_entry_name、Sequence(序列)、Length(长度)、Charge(电荷)、Prediction_imbal(预测结果)等
  • uniprot_sprot_short_cationic_novel_putative_amps_by_amplify.tsv:包含短阳离子型新型候选抗菌肽序列信息,核心字段与上述文件一致
  • 文档文件(.pdf格式):
  • data_description.pdf:数据说明文档
  • 归档文件(.zip格式):
  • datasets.zip:数据集压缩包

适用场景

  • 抗菌肽序列筛选研究:用于识别具有潜在抗菌活性的肽序列
  • 生物信息学分析:探究抗菌肽序列的长度、电荷等特征与抗菌活性的关联
  • 药物研发辅助:为新型抗菌肽类药物的开发提供候选序列库
  • 数据库补充:可用于扩展现有抗菌肽序列数据库的内容
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 63.55 MiB
最后更新 2025年12月4日
创建于 2025年12月4日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。