人类跨膜蛋白预测与可视化数据集2022

数据集概述

该数据集包含四百九十六个人类跨膜蛋白的三维结构及膜嵌入预测结果,基于AlphaFold结构与蛋白语言模型生成,按α螺旋和β桶结构分类存储,提供多方法膜嵌入预测及可视化工具。

文件详解

  • 核心压缩包:
  • TMvis496.tar.gz: 压缩包文件,包含所有数据文件,内部按α螺旋(alpha)和β桶(beta)结构分为两个目录,每个目录下以UniProt ID命名的子目录包含对应蛋白的序列、结构及膜嵌入预测文件
  • 序列文件:
  • TMvis496.fasta: FASTA格式文件,包含四百九十六个蛋白的序列信息
  • 可视化文件:
  • TMvis_project_overview.png: PNG格式图片,展示数据集构建流程的图形化概述
  • 代码文件:
  • TMvis.ipynb: Jupyter Notebook文件,提供蛋白三维结构及膜嵌入预测结果的可视化代码
  • 说明文件:
  • TMvis_readme.txt: TXT格式文件,包含数据集的详细说明文档

适用场景

  • 蛋白质结构研究: 分析人类跨膜蛋白的三维结构特征
  • 膜蛋白功能分析: 研究跨膜蛋白的膜嵌入模式与功能关系
  • 生物信息学工具开发: 验证跨膜蛋白预测算法的准确性
  • 药物靶点研究: 探索跨膜蛋白作为药物靶点的潜在价值
  • 计算生物学教学: 跨膜蛋白结构预测与可视化的教学案例
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 158.4 MiB
最后更新 2025年12月8日
创建于 2025年12月8日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。