数据集概述
本数据集为论文“Detection of Gene Fusions in Long-Read Transcriptome Sequencing Data with GFvoter”的补充材料,包含GFvoter及其他基因融合检测工具的运行命令、检测结果,以及真实和模拟RNA测序数据集的基因融合基准事件,共5个文件,支持实验结果的复现与工具性能评估。
文件详解
- run_command.txt
- 文件格式:TXT
- 字段映射介绍:包含运行GFvoter及其他基因融合检测工具的精确命令,记录实验所用参数与选项,确保实验可复现。
- Results of GFvoter.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内为GFvoter工具生成的输出结果,包含基因融合检测结果及各方法对最终融合调用的贡献评分向量。
- Results of Others.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内为研究中使用的其他基因融合检测工具的输出结果,用于与GFvoter的检测结果对比。
- realdata_ground_truth.txt
- 文件格式:TXT
- 字段映射介绍:真实RNA测序数据集的基因融合基准事件列表,用于评估GFvoter及其他工具在真实数据上的准确性,数据源自https://github.com/Oshlack/JAFFA/blob/master/known_fusions.txt。
- simulatedata_ground_truth.txt
- 文件格式:TXT
- 字段映射介绍:模拟RNA测序数据集的基因融合基准事件列表,格式为基因融合对(如AADAT:VMP1),用于评估工具在模拟数据上的性能。
- README.md
- 文件格式:MD
- 字段映射介绍:数据集说明文档,概述补充材料的内容与各文件用途。
数据来源
论文“Detection of Gene Fusions in Long-Read Transcriptome Sequencing Data with GFvoter”
适用场景
- 基因融合检测工具评估:对比GFvoter与其他工具在真实和模拟数据集上的检测准确性。
- 生物信息实验复现:使用run_command.txt中的命令复现论文中的基因融合检测实验。
- 基因融合基准数据应用:利用真实和模拟基准事件验证新基因融合检测方法的性能。
- 基因融合评分机制研究:分析GFvoter结果中的评分向量,探究多方法融合的基因融合检测策略。