数据集概述
本数据集专为RNA二级结构预测算法的基准测试设计,包含6个压缩文件,提供用于测试机器学习方法在RNA二级结构预测任务中性能的相关数据,无训练集/测试集、数据/标签或原始/处理数据的划分。
文件详解
- 压缩文件集合
- 文件名称:test-set-1-fasta.zip、test-set-1-bpseq.zip、test-set-2-fasta.zip、test-set-2-bpseq.zip、test-set-3-fasta.zip、test-set-3-bpseq.zip
- 文件格式:ZIP
- 字段映射介绍:包含三组测试集数据,每组测试集均提供两种格式文件,其中fasta格式文件通常存储RNA序列信息,bpseq格式文件通常存储RNA碱基配对信息(用于二级结构表示)
适用场景
- RNA二级结构预测算法性能评估: 用于测试不同机器学习方法在RNA二级结构预测任务中的准确性和效率。
- 生物信息学算法对比研究: 支持对多种RNA二级结构预测算法进行标准化基准测试与结果对比。
- 机器学习模型优化: 为RNA二级结构预测模型的训练与调优提供测试数据支撑。
- 生物数据格式应用研究: 分析fasta和bpseq格式在RNA二级结构预测任务中的数据表示效果。