数据集概述
本数据集包含两组人类小BAM文件,分别用于RNA-seq和全外显子测序(WES)可视化教学练习。RNA-seq数据来自上皮间质转化细胞系的0天(未诱导)和7天(诱导后)样本,WES数据来自非小细胞肺癌患者的肿瘤和血液组织样本,所有数据均从开放获取的SRA数据集处理而来。
文件详解
- RNA-EMT.zip
- 文件格式:ZIP
- 内容说明:包含人类RNA-seq BAM文件,对应上皮间质转化细胞系的Day 0(未诱导)和Day 7(诱导后)样本,序列比对至HG19基因组的18号染色体,基因CDH2为研究重点。
- WES-LUNG.zip
- 文件格式:ZIP
- 内容说明:包含人类WES BAM文件,来自非小细胞肺癌患者的肿瘤和血液组织样本,序列比对至HG19基因组,保留了DUSP27、KRAS等基因的序列片段。
数据来源
Yang et al.(https://doi.org/10.1128/mcb.00019-16,SRA: PRJNA304419)、Ju et al.(https://doi.org/10.1101/gr.133645.111,SRA: ERP001071)
适用场景
- RNA-seq可视化教学:用于演示RNA-seq数据的BAM文件格式、序列比对结果及基因表达变化(如CDH2)的可视化分析。
- WES可视化教学:用于展示全外显子测序数据的BAM文件解读、肿瘤与正常组织的序列差异(如DUSP27、KRAS基因)可视化。
- 生物信息学入门培训:帮助初学者熟悉Illumina测序数据的BAM文件结构、比对工具(STAR、BWA)的应用及基因组可视化工具的操作。
- 测序数据处理练习:作为小样本数据集,支持RNA-seq和WES数据的比对结果验证、基因区域提取等基础生物信息学分析练习。