蛋白质亚细胞定位数据集-植物-真菌及动物细胞-2003-2004

蛋白质亚细胞定位数据集-植物-真菌及动物细胞-2003-2004 数据来源:互联网公开数据 标签:蛋白质,亚细胞定位,细胞生物学,蛋白质组学,SWISS-PROT,植物,真菌,动物,细胞器 数据概述: 本数据集基于SWISS-PROT数据库第42版(2003-2004年)构建,收录了动物、真菌和植物的蛋白质序列数据。数据集包含5959个蛋白质,并标注了它们在11种不同的亚细胞定位中的一种:叶绿体、细胞质、内质网、细胞外空间、高尔基体、溶酶体、线粒体、细胞核、过氧化物酶体、质膜和液泡。其中,植物细胞和真菌细胞的蛋白质数据包含全部11种定位,而动物细胞与它们共享大部分定位,但使用溶酶体替代了液泡。本数据集的主要变量为蛋白质序列。 数据用途概述: 该数据集适用于蛋白质亚细胞定位预测、蛋白质结构与功能关系研究、细胞生物学教学等多种场景。研究人员可以利用此数据训练和评估亚细胞定位预测算法,探索蛋白质序列特征与亚细胞定位之间的关联;教育工作者可以使用该数据集进行细胞生物学相关课程的教学,帮助学生理解蛋白质在细胞内的分布规律。此外,该数据集也为蛋白质组学研究提供了重要的基础数据。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.96 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。