数据集概述
本数据集是关于白血病细胞系REH的多组学表征研究成果,包含通过短读长和长读长测序技术获得的基因组、转录组等多组学数据及分析结果,为深入研究REH细胞系的分子特征提供支持。
文件详解
- 覆盖深度分析文件:
- samtools.coverage.illumina.txt、samtools.coverage.ont.txt、samtools.coverage.pb.txt: 由
samtools coverage工具生成的覆盖度分析结果文件,TXT格式
- copycat.ont.coverage.10kb.csv、copycat.pb.coverage.10kb.csv、copycat.pcrfree.coverage.10kb.csv: 由
copycat工具生成的10kb窗口的分箱覆盖度数据,CSV格式
- 结构变异(SV)数据集文件:
- 原始文件: illumina.tiddit.vcf、ont.sniffles.vcf、pb.sniffles.vcf(VCF格式)
- 过滤文件: REH.svs.filtered.csv(CSV格式)
- 单核苷酸变异(SNV)数据集文件:
- 过滤与注释文件: REH.mutect.filtered.ann.vcf.gz(压缩VCF格式)
- 融合基因数据集文件:
- 短读长分析文件: GM12878.fusionreport.txt、illumina.all.txt、illumina.filtered.csv、REH.arriba.fusions.tsv、REH.fusioncatcher.fusion-genes.txt、REH.pizzly.txt、REH.squid.fusions.annotated.txt、REH.starfusion.abridged.tsv、REH.pdf(包含TXT、CSV、TSV、PDF等格式)
- 长读长分析文件: cupcake.long.csv、cupcake.std.csv、jaffa_results.csv(CSV格式)
- 过滤文件: REH.fusions.filtered.csv(CSV格式)
适用场景
- 白血病细胞系分子特征研究: 分析REH细胞系的基因组结构变异、单核苷酸变异及基因融合事件
- 测序技术比较研究: 对比短读长与长读长测序在基因组覆盖度、结构变异检测等方面的性能差异
- 肿瘤基因组学研究: 为白血病相关的基因变异、融合基因功能研究提供数据支持
- 生物信息学方法验证: 用于验证结构变异检测、基因融合预测等生物信息学工具的准确性