数据集概述
本数据集为SSAM-lite工具提供测试用的空间转录组数据,包含来自不同研究的样本数据。每个数据集文件夹内有mRNA位置文件、基因特征文件、细胞类型调色板文件及说明文档,覆盖小鼠脑体感皮层、人胰腺等组织的空间转录组数据,用于工具功能验证与使用演示。
文件详解
- 压缩包文件:
- 文件名称:SSAM-lite_test_data.zip
- 文件格式:ZIP
- 内容说明:包含多个数据集文件夹,每个文件夹内的文件结构为:
- mRNA位置文件:CSV格式,遵循Starfish pipeline的DecodedSpots格式,含mRNA靶标、x坐标、y坐标字段
- 基因特征文件:CSV格式,行代表细胞类型,列代表基因,数值或二进制值关联mRNA表达与细胞类型
- 细胞类型调色板文件:CSV格式,定义细胞类型对应的自定义颜色
- README文件:参考原始出版物信息及数据集规格说明
- 数据集规格示例:
- Codeluppi_osmFISH:方法osmFISH,组织为小鼠脑体感皮层,mRNA斑点1802589个,基因33个,特征对应31种细胞类型,DOI:10.1038/s41592-018-0175-z
- Tosti_ISS_Pancreas:方法ISS,组织为人胰腺,mRNA斑点461078个,基因138个,特征对应16种细胞类型,DOI:10.1053/j.gastro.2020.11.010
数据来源
不同公开出版物(具体见各数据集README中的原始出版物引用)
适用场景
- SSAM-lite工具功能测试:验证工具对空间转录组数据的处理、分析能力
- 空间转录组数据分析流程演示:作为示例数据展示空间转录组数据的结构与分析方法
- 生物信息工具开发参考:为空间转录组相关工具的开发提供标准化测试数据模板
- 教学与培训:用于空间转录组分析工具的使用教学,帮助用户熟悉数据格式与分析流程
- 跨组织空间转录组数据对比:通过不同组织(小鼠脑、人胰腺)的测试数据,对比空间转录组特征差异