人类蛋白质图谱单细胞分类数据集2021

数据集概述

本数据集为2021年人类蛋白质图谱单细胞分类竞赛的训练数据,包含不同分辨率的PNG图像文件、图像标签文件及测试集提交样例文件,用于预测图像中每个细胞的蛋白质细胞器定位标签,涉及19种不同标签类型。

文件详解

  • 训练与测试图像文件:
  • train.zip:训练集图像压缩包,包含16位PNG格式图像,分辨率为1728x1728、2048x2048或3072x3072,每个样本含4个不同滤镜文件([filename]_[filter color].png),对应微管(红)、细胞核(蓝)、内质网(黄)、目标蛋白(绿)通道
  • test.zip:测试集图像压缩包,含PNG格式图像,部分数据隐藏
  • 标签与提交文件:
  • train.csv:训练集图像标签文件,包含ID(样本基础文件名)和Label(图像级标签)列
  • sample_submission.csv:测试集提交样例文件,包含ID列,用于指导提交格式

适用场景

  • 生物信息学研究:分析蛋白质在细胞内的亚细胞定位模式
  • 机器学习分类任务:训练单细胞蛋白质定位分类模型
  • 细胞生物学研究:探究不同细胞类型中蛋白质分布特征
  • 生物图像分析:开发细胞分割与标签预测算法
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.1 MiB
最后更新 2025年12月11日
创建于 2025年12月11日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。