多药耐药细菌新药靶点生物信息学识别补充数据集

数据集概述

本数据集为多药耐药细菌新药靶点生物信息学识别研究的补充数据,包含两个核心部分:基于CD-HIT工具聚类的高序列相似性蛋白质簇数据,以及各蛋白质簇的序列比对文件,为耐药细菌靶点研究提供支撑。

文件详解

  • Dataset D1.csv: CSV格式文件,包含CD-HIT工具生成的109个蛋白质簇数据,每个簇内蛋白质序列相似性>90%。字段包含Cluster ID、蛋白质序列ID及相似性百分比(代表序列标注为*)。
  • Dataset D2.zip: ZIP压缩文件,包含109个ALN格式的序列比对文件,对应Dataset D1中的每个蛋白质簇,用于多序列比对分析。

适用场景

  • 生物信息学研究:用于分析多药耐药细菌的蛋白质序列相似性与聚类特征
  • 药物靶点发现:辅助识别耐药细菌中的潜在新药靶点蛋白质
  • 分子生物学分析:支持蛋白质序列比对与进化关系研究
  • 微生物学研究:探究耐药细菌蛋白质组的结构与功能关联
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.15 MiB
最后更新 2025年12月15日
创建于 2025年12月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。