斯坦福卵巢癌组织微阵列数据库-2011-toddgardiner
数据来源:互联网公开数据
标签:卵巢癌,组织微阵列,TMA,医学影像,癌症分类,斯坦福大学,图像处理,科研数据
数据概述:
本数据集包含25张组织微阵列(Tissue Microarray, TMA)切片,适用于训练机器学习模型。数据来源于斯坦福组织微阵列数据库,该数据库提供了公开使用且无需登录的组织微阵列块。数据集中的25个样本包括20个用于测试的微阵列标本,分别来自两个不同的组织微阵列块:TA-42和TA-127。具体来说,TA-42块包含了12个独特的微阵列观察样本(包括CC、EC、MC三种类型),而TA-127块则提供了8个样本,其中有2个有用的观察样本,但每个样本经过四种不同的染色处理,因此总共提供了8个观察样本。每个样本的ID号包含2011年份标识,其中第5位数字作为唯一标识符。
数据集中的图像分为原始图像和处理后的图像。原始图像为1504x1440像素的JPEG格式,而处理后的图像为1504x1504像素的PNG格式。数据使用条款(TOU)指出,该数据集采用非商业性使用且需要署名的Creative Commons许可证。此外,数据集提供了一个在线链接,用户可以通过访问链接查看详细的描述和相关信息。
数据用途概述:
该数据集适用于癌症分类挑战、医学图像处理研究、机器学习模型训练等多种应用场景。研究人员可以利用这些图像数据进行模型训练和评估,特别是在卵巢癌相关的研究中。此外,数据集中的正常组织样本和未分类的肿瘤样本也可以用于训练异常类别识别模型,这对于未来的癌症分类挑战具有极高的价值。引用该数据集时,请参考以下文献:
Robert J. Marinelli, Kelli Montgomery, Chih Long Liu, Nigam H. Shah, Wijan Prapong, Michael Nitzberg, Zachariah K. Zachariah, Gavin J. Sherlock, Yasodha Natkunam, Robert B. West, Matt van de Rijn, Patrick O. Brown, and Catherine A. Ball. The Stanford Tissue Microarray Database. Nucleic Acids Res 2008 36(Database issue): D871-7. Epub 2007 Nov 7 doi:10.1093/nar/gkm861